CaptchBreaker/training/train_3d_text.py

"""
训练 3D 立体文字验证码识别模型 (ThreeDCNN)

用法: python -m training.train_3d_text
"""

from config import (
    THREED_CHARS,
    IMAGE_SIZE,
    SYNTHETIC_3D_TEXT_DIR,
    REAL_3D_TEXT_DIR,
)
from generators.threed_gen import ThreeDCaptchaGenerator
from models.threed_cnn import ThreeDCNN
from training.train_utils import train_ctc_model


def main():
    img_h, img_w = IMAGE_SIZE["3d_text"]
    model = ThreeDCNN(chars=THREED_CHARS, img_h=img_h, img_w=img_w)

    print("=" * 60)
    print("训练 3D 立体文字验证码识别模型 (ThreeDCNN)")
    print(f"  字符集: {THREED_CHARS}  ({len(THREED_CHARS)} 字符)")
    print(f"  输入尺寸: {img_h}×{img_w}")
    print("=" * 60)

    train_ctc_model(
        model_name="threed_text",
        model=model,
        chars=THREED_CHARS,
        synthetic_dir=SYNTHETIC_3D_TEXT_DIR,
        real_dir=REAL_3D_TEXT_DIR,
        generator_cls=ThreeDCaptchaGenerator,
        config_key="3d_text",
    )


if __name__ == "__main__":
    main()