10 分钟 AI 入门
Yolo + Fine-tune SDXL
Yolo
YOLO(You Only Look Once)
是一种流行的目标检测算法,它以高速和准确性而闻名。相对于传统的目标检测算法,YOLO采用单阶段检测的方式,即在一次前向传播中同时预测图像中所有对象的边界框和类别。
The Summit is what drives us, but the climb itself is what matters.
– Conrad Anker
如何训练自己的 YOLO 检测模型
收集并标注一个包含目标对象的数据集,为每个对象添加边界框和类别标签。
1
数据集
使用现有的 YOLO 实现,加载预训练权重,配置训练参数,并使用数据集进行模型训练。
2
训练
加载训练好的权重,在新图像或视频上应用模型进行目标检测,获取检测边界框和类别信息。
3
运行
标注
收集和标注一个适合您应用场景的目标检测数据集。确保数据集中包含了您感兴趣的对象,并为每个对象标注边界框和类别信息。可以使用标注工具(如 LabelImg、Roboflow 等)来辅助标注过程,并将数据集划分为训练集和验证集。
训练
在数据集准备好后,您可以使用已有的 YOLO 实现(如YOLOv5、YOLOv8 等)进行模型训练。通常,您需要下载相应的预训练权重作为起点,并使用训练脚本或配置文件进行训练。在训练过程中,您需要指定数据集路径、类别数量、训练参数等,并根据需要调整学习率和迭代次数等超参数。训练可能需要一定的时间和计算资源,在 GPU 支持下速度会更快。
运行
您可以使用训练得到的权重文件进行目标检测。通过加载权重并使用适当的推理代码,您可以将模型应用于新的图像或视频。在运行时,模型会输出检测到的边界框和类别信息。您可以根据需要进行后续处理,如可视化、结果过滤等。
如何微调自己的人脸 LoRA 模型
收集包含人脸的图像数据集,并为每个图像提供相应的标注框信息,确保数据集具有多样性和代表性。
1
数据集
使用预训练模型作为基础,在数据集上进行微调训练。根据需要,可以冻结部分层或完全替换最后一层。通过传入图像和标签,计算损失并更新模型权重,经过多次迭代训练以达到满意的性能。
2
训练
运行微调后的人脸 LoRA 模型,输入图像并检测人脸。评估模型的准确率、召回率等指标,根据需求进行模型调整和优化。确保代码实现严谨,参考相关文档和最佳实践,以确保任务的成功完成。
3
运行
准备人脸素材
1.png
2.png
3.png
-
图像可以是你自己、你的宠物或任何独特的物体。
-
图像应仅包含主体本身,无背景噪音或其他物体。
-
未经他人同意,请勿使用其他人的图像。
-
图像可以是JPEG或PNG格式。
-
尺寸和大小并不重要。
-
文件名并不重要。
训练图像原则
训练
推荐使用 replicate 提供无代码训练方式,可以在 10 mins 左右完成训练等到你的结果
replicate
https://replicate.com/
1
准备图片
3
创建模型
5
训练完成
2
打包上传
4
启动训练
https://replicate.com/account/api-tokens
获取 Token
上传数据集
RESPONSE=$(curl -s -X POST -H "Authorization: Token $REPLICATE_API_TOKEN" https://dreambooth-api-experimental.replicate.com/v1/upload/data.zip)
curl -X PUT -H "Content-Type: application/zip" --upload-file data.zip "$(jq -r ".upload_url" <<< "$RESPONSE")"
SERVING_URL=$(jq -r ".serving_url" <<< $RESPONSE)
echo $SERVING_URL
在运行后获取数据集 URL
运行训练
Philosophy
Once all is removed that can be removed, that is how designs are truly in their simplest form.
Thank You!
Questions?
Palette
By Awe
Palette
- 75