目前先不使用 RAG ,採用爬蟲將 GMIC 網頁的文檔整理成一個 markdown 文件,直接併入提示詞中
(使用 Gemini 2.5 flash 模型
這是 GMIC 所有指令 將3D運算與機器學習等等不會用到的指令排除後逐一抓取
共有 496 個指令 他們的頁面如左圖 利用爬蟲將其整理為右圖文件
Ai 對於部分指令仍會有理解錯誤的情形
例如 balance_gamma 這個指令 ai 時常將冷暖色調整相反
另一個例子是 GMIC 雖然是用指令操作但仍有 圖層 這個概念 ai沒辦法完全理解 導致指令錯誤
手動修改之前生成的操作文檔
於特定指令給出更詳細說明
基本上能解決大部分問題
(第一頁的兩張圖即是修正後 ai 正確使用 clut 指令的結果
直接將文檔嵌入提示詞,提示詞會非常的長
可能還是要利用可以外掛資料庫的聊天模型服務
Ai 偏好使用現成濾鏡而非從基礎效果開始操作
例如 clut 這個指令有超多濾鏡可以套用, ai 偏好單純從名字上挑選他覺得相關的直接套用, 容易發生對濾鏡效果誤解或風格太強烈的情況
我們認為可以繼續從提示詞做優化 將這種預設濾鏡標注為不建議使用
並著重強調一些基礎的修圖指令
(其實基礎的修圖指令不多,以下列出最基礎常用的指令
亮度 對比 飽和度 高亮度 陰影 色溫 色調
暗角 模糊 曲線 顆粒 清晰度
但尚未嘗試這個實作
解決上頁問題
並新增互動模式(即將上輪的輸出與使用者建議重複輸入後要求模型做少部分更改
這個調色軟體雖然支援 xmp 格式的檔案
但語法與最普遍的 Lightroom 仍有差異
(加上我連 GUI 版本的都不會用找不到匯入調色檔案的地方)
暫時沒有進一步嘗試
By 翊庭jx06 T