Flux Fill LoRA Train

Этот репозиторий содержит продвинутый скрипт для обучения модели FluxFill, основанный на архитектуре T2ITrainer.

Проект адаптирован для решения задачи заполнения изображений (image inpainting) с использованием передовых техник глубокого обучения.

Также наконец-то стабильное обучение задач Outpaint (дорисовки изображений)

Ключевые особенности

🚀 Эффективное обучение с применением LoRA (Low-Rank Adaptation)
💾 Автоматическое кэширование эмбеддингов и латентных представлений
🌈 Поддержка Flux Transformer для генерации изображений высокого разрешения
⚙️ Гибкая конфигурация через параметры в начале скрипта
📊 Интеграция с TensorBoard для мониторинга обучения
🐇 Оптимизация памяти через gradient checkpointing

Быстрый старт

Установка зависимостей:

PyTorch устанавливается отдельно для вашей версии CUDA.

SageAttention устанавливается также отдельно.

Мог что пропустить в requirements.txt - устанавливается через pip install.

Настоятельно рекомендуется установить OpenCV с CUDA для скорости.

pip install -r requirements.txt

Подготовка датасета:

Разместите изображения в структуре:

dataset/train/
    ├── image1_F.jpg    # Фактическое изображение
    ├── image1_G.jpg    # Эталонное изображение
    ├── image1_M.png    # Маска
    └── image1.txt      # Описание (опционально)

Настройка параметров: Отредактируйте параметры в верхней части скрипта:

# Общие настройки
PRETRAINED_MODEL_NAME = "black-forest-labs/FLUX.1-Fill-dev"
SEED = 41
TRAIN_DATA_DIR = "dataset/train"
# ... другие параметры ...

Запуск обучения:

accelerate launch train_flux_fill.py

Конфигурация обучения

Основные настраиваемые параметры:

Параметр	Описание	По умолчанию
`LEARNING_RATE`	Скорость обучения	1e-4
`TRAIN_BATCH_SIZE`	Размер батча	2
`NUM_TRAIN_EPOCHS`	Количество эпох	5
`LORA_RANK`	Размерность LoRA-матриц	64
`MIXED_PRECISION`	Смешанная точность (fp16/bf16)	"bf16"
`OUTPUT_DIR`	Директория для сохранения чекпоинтов	"train"

Системные требования

Python 3.12+
PyTorch 2.0+
NVIDIA GPU с 12+ GB VRAM
CUDA 12.*

Мониторинг обучения

Для просмотра метрик в реальном времени:

tensorboard --logdir=logs

Особенности реализации

Эффективная работа с памятью:
- Gradient checkpointing
- Пакетная обработка схожих изображений
- Оптимизированные латентные представления
Продвинутые техники обучения:
- LoRA-адаптация
- Несколько схем взвешивания потерь
- Смешанная точность
- Регуляризация временных шагов
Гибкий пайплайн:
- Автоматическая обработка датасета
- Поддержка возобновления обучения
- Валидация во время обучения

Лицензия

Проект распространяется под лицензией Apache 2.0. Полный текст лицензии доступен в файле LICENSE.

Name		Name	Last commit message	Last commit date
Latest commit History 12 Commits
.gitignore		.gitignore
LICENSE		LICENSE
README.md		README.md
requirements.txt		requirements.txt
train.py		train.py

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Uh oh!

Repository files navigation

Flux Fill LoRA Train

Ключевые особенности

Быстрый старт

Конфигурация обучения

Системные требования

Мониторинг обучения

Особенности реализации

Лицензия

About

Uh oh!

Releases

Packages

Languages

License

SlimRG/Flux-Fill-LoRA-Train

Folders and files

Latest commit

History

Repository files navigation

Flux Fill LoRA Train

Ключевые особенности

Быстрый старт

Конфигурация обучения

Системные требования

Мониторинг обучения

Особенности реализации

Лицензия

About

Resources

License

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages