配置结构(Schema)#

本页按顶层键梳理 FluxVLA 常用配置结构,便于从“字段位置”快速回到具体教程。

用途#

  • 快速理解配置文件由哪些顶层块组成

  • 明确字段修改优先级(必须改 / 建议改 / 按需改)

  • 提供训练、评估、推理的最小配置路径

顶层结构#

model = dict(...)
# inference_model = dict(...)  # 可选
train_dataloader = dict(...)
runner = dict(...)
inference = dict(...)
eval = dict(...)

核心字段速查#

model#

字段

说明

type

模型类型

pretrained_name_or_path

预训练权重

vlm_backbone / vla_head

子模块配置

name_mapping

权重映射

train_dataloader#

字段

说明

per_device_batch_size

每卡 batch size

per_device_num_workers

每卡 worker 数

dataset

数据集与 transforms 配置

runner#

字段

说明

type

训练 Runner 类型

max_epochs / learning_rate

核心训练超参数

metric

指标与日志配置

lr_scheduler_type / warmup_ratio

学习率策略

inference / eval#

字段

说明

type

推理或评测 Runner

dataset

输入处理配置

denormalize_action

动作反归一化

operator(inference)

机器人通信接口

最小示例#

model = dict(type='LlavaVLA', ...)
train_dataloader = dict(per_device_batch_size=8, ...)
runner = dict(type='FSDPTrainRunner', max_epochs=6, learning_rate=2e-5, ...)

关联教程#