配置结构（Schema）#

本页按顶层键梳理 FluxVLA 常用配置结构，便于从“字段位置”快速回到具体教程。

用途#

快速理解配置文件由哪些顶层块组成
明确字段修改优先级（必须改 / 建议改 / 按需改）
提供训练、评估、推理的最小配置路径

顶层结构#

model = dict(...)
# inference_model = dict(...)  # 可选
train_dataloader = dict(...)
runner = dict(...)
inference = dict(...)
eval = dict(...)

核心字段速查#

`model`#

字段	说明
`type`	模型类型
`pretrained_name_or_path`	预训练权重
`vlm_backbone` / `vla_head`	子模块配置
`name_mapping`	权重映射

`train_dataloader`#

字段	说明
`per_device_batch_size`	每卡 batch size
`per_device_num_workers`	每卡 worker 数
`dataset`	数据集与 transforms 配置

`runner`#

字段	说明
`type`	训练 Runner 类型
`max_epochs` / `learning_rate`	核心训练超参数
`metric`	指标与日志配置
`lr_scheduler_type` / `warmup_ratio`	学习率策略

`inference` / `eval`#

字段	说明
`type`	推理或评测 Runner
`dataset`	输入处理配置
`denormalize_action`	动作反归一化
`operator`（inference）	机器人通信接口

最小示例#

model = dict(type='LlavaVLA', ...)
train_dataloader = dict(per_device_batch_size=8, ...)
runner = dict(type='FSDPTrainRunner', max_epochs=6, learning_rate=2e-5, ...)

关联教程#

配置详解：../tutorials/config.md
私有数据集配置：../tutorials/private_dataset_config.md
模型扩展：../tutorials/private_model.md
Engine 扩展：../tutorials/private_engine.md