huggingface-vision-trainer

Name: huggingface-vision-trainer
Availability: InStock
Author: LAF-US

Official

Train vision models on Hugging Face Jobs.

Software Engineering #object-detection #image-classification #huggingface-jobs #dataset-prep #hub-push #vision-training #sam-segmentation

AuthorLAF-US

Version1.0.0

Installs0

System Documentation

What problem does it solve?

Trains and fine-tunes vision models (object detection, image classification, and SAM/SAM2 segmentation) on Hugging Face Jobs cloud GPUs, with COCO-style dataset preparation, augmentation, evaluation, and Hub persistence.

Core Features & Use Cases

Supports object detection (DETR/RT-DETR, YOLOS), image classification (timm/ViT), and SAM/SAM2 segmentation.
Provides end-to-end training pipelines with dataset prep, augmentation, evaluation, and Hub persistence to HF Hub.
Includes cost estimation and Trackio monitoring for production-grade training workflows.

Quick Start

Submit a vision training job on HF Jobs using the provided scripts and secrets to push results to the Hub.

Dependency Matrix

Required Modules

transformers>=5.2.0accelerate>=1.1.0albumentations>=1.4.16timmdatasets>=4.0torchmetricspycocotoolstrackiohuggingface_hubevaluatescikit-learntorchvisionmonai

Components

scriptsreferences