本次測試了使用 gemini cli 的 mcp 功能 來控制 chrome 瀏覽器 閱讀 與 debug 輸入 等功能 效果驚人
安裝需求:
node.js 22 up
google chrome
github:
https://github.com/ChromeDevTools/chrome-devtools-mcp
Easy is power
本次測試了使用 gemini cli 的 mcp 功能 來控制 chrome 瀏覽器 閱讀 與 debug 輸入 等功能 效果驚人
安裝需求:
node.js 22 up
google chrome
github:
https://github.com/ChromeDevTools/chrome-devtools-mcp
串接地端 Ollama LLM安裝:
nodejs
codex cli (注意版本 0.13.0 如果是 0.21.0 指令會不同)
ollama
gpt-oss:20b
1. 安裝 nodejs
下載點: https://nodejs.org/zh-tw/download
2. 安裝 codex cli
開啟 win cmd.exe 下指令即可安裝
# 查詢版本 codex --version # 查詢可用版本 npm view @openai/codex versions # 移除安裝 npm uninstall -g @openai/codex # 安裝 npm install -g @openai/codex # 安裝指定版本 npm install -g @openai/[email protected] npm install -g @openai/[email protected]
3. 串接地端 Ollama LLM
下載點: https://ollama.com/download
設定 Ollama
安裝好 Ollama 後,開啟命令視窗(win cmd.exe),執行
ollama serve
把服務跑起來,開啟網頁連到http://localhost:11434/ 或 http://127.0.0.1:11434/ 會顯示 Ollama is running
4. cmd.exe 設定檔
第一次執行需要設定環境變數:
set OPENAI_API_KEY=ollama set CODEX_OSS_BASE_URL=http://127.0.0.1:11434/v1 set CODEX_OSS_PORT=11434 # 0.13.0 codex --provider ollama -m gpt-oss:20b # 0.21.0 codex --oss -m gpt-oss:20b
之後就可以使用這個來開 (這點感覺做的沒有很好 指令好長…怎麼讀取 /.codex/config.json or /.codex/config.yaml 要在翻看看技術文件)
# 0.13.0 codex --provider ollama -m gpt-oss:20b # 0.21.0 codex --oss -m gpt-oss:20b
懶人建議:
自動 yes 指令增加
# 0.13.0 codex --provider ollama -m gpt-oss:20b --full-auto # 0.21.0 codex --oss -m gpt-oss:20b --ask-for-approval on-failure
參考資料:
codex 簡介 : https://openai.com/codex/
codex cli : https://github.com/openai/codex
串接地端 Ollama LLM : https://www.gss.com.tw/blog/github-copilot-ollama-local-llm
如何在 OpenAI Codex CLI 中集成 Ollama : https://juejin.cn/post/7516362698278453286
硬體 5090 使用 ollama 執行 gpt-oss-20b
安裝下載 直接執行 就可以做基本的運作


執行的效果 有比預想的好 重點是反饋速度極佳 不過在測試一些難度較高的小程式 表現不太行
參考資料:
簡介:
使用 You tube 的直播功能 接 OBS 使用 vtuber模型(動態捕捉) + vtuber模型(製作) + 變聲器 + 自動字幕
以下是大概的介紹
訓練方式參考:
Stable Diffusion web UI x Kohya’s GUI:訓練 LoRA 模型教學,快速上手最流行的 AI 繪圖訓練方式!
kohya_ss 安裝前準備
專為看漫畫而設計的看圖軟體 – HoneyView,有讀取壓縮檔中圖片的特異功能,支援的壓縮檔格式:ZIP/CBZ、RAR/CBR、LZH/LHA、TAR、7Z、HV3、ALZ、EGG,最重要的是支援Unicode,可以顯示JPG的EXIF相片資訊,可以設定1~90秒切換的幻燈片秀圖模式,支援圖片格式:BMP、JPG、GIF/Animation GIF、TIFF、PNG、TGA、PSD、JPEG 2000(JP2, J2K)、JPEG XR/HD Photo(WDP, HDP)、DNG(Adobe Digital Negative)。
下載連結→ https://www.azofreeware.com/p/honeyview.html
如果要在 windows 底下 使用 xampp 執行多個不同php版本
我個人建議採用 port 切割的方式 也方便測試各版本的相容性
閱讀全文〈Windows 使用 XAMPP 執行多個不同的 PHP 版本〉
安裝ComfyUI
#
你需要4GB以上VRAM的顯示卡、8GB以上RAM、20GB的硬碟空間。
Windows
#
參考 Github說明,Nvidia顯示卡的用戶,下載 Github Releases的ComfyUI_windows_portable_nvidia_cu118_or_cpu.7z檔案,解壓縮
將ckpt模型放到程式資料夾下的ComfyUI\models\checkpoints。或者你可以設定與SD WebUI 共用模型資料夾(後述)
按run_nvidia_gpu.bat批次檔,等它裝完依賴套件。
讓ComfyUI與SD WebUI共用模型資料夾
#
你可以讓ComfyUI與SD WebUI共用模型資料夾,避免浪費硬碟空間。
將ComfyUI資料夾下的extra_model_paths.yaml.example檔案重新命名為extra_model_paths.yaml,編輯該檔案
填入以下內容,與SD WebUI共用模型資料夾:
安裝ComfyUI
plesk 發生幽靈域名
用 root 登入 ssh 下這個指令:
plesk repair web -y
ChatGPT Writer – 在 Gmail 中使用 ChatGPT 來潤飾信件
Write emails & messages, fix grammar mistakes, rephrase text, change writing tone, summarize text, and much more using ChatGPT AI. Works on all sites. Free to use.
內容出處: ChatGPT Writer – Write emails, messages, and more using AI
線上抽獎
https://vitozyf.github.io/lucky-draw/index.html#/
可以自訂名單 與 獎項
原理:
圖片 製做成 GIF 動圖 然後 再轉檔 mp4 影片
圖片 -> gif
https://www.iloveimg.com/zh-tw/jpg-to-image#panel-gif
gif -> mp4影片
https://ezgif.com/gif-to-mp4
1.1版模型載點: !!!!!!!!重要提醒!!!!!!!! 只需下載.pth的模型(不需要.yaml檔案)並放入下方路徑: AI資料夾\models\ControlNet
載點: https://huggingface.co/lllyasviel/Con…
ControlNet擴充: (複製下方網址到webui上,使用從網址安裝即可安裝) https://github.com/Mikubill/sd-webui-…
pix2pix 用於改變整張圖的風格
canny 適用於給線稿上色,或將圖片轉化為線搞後重新上色,比較適合人物。
openpose 根據圖片生成動作骨骼中間圖,然後生成圖片,使用真人圖片是最合適的,因為模型庫使用的真人素材。 閱讀全文〈[整理]stable diffusion ControlNet1.1〉
wildcards 安裝
https://github.com/AUTOMATIC1111/stable-diffusion-webui-wildcards
ControlNet 模型下載
(1.0) https://huggingface.co/lllyasviel/ControlNet/tree/main/models
(1.1) https://huggingface.co/lllyasviel/ControlNet-v1-1/tree/main
https://github.com/Scholar01/sd-webui-mov2mov
擴充功能來源: Scholar01/sd-webui-mov2mov *需要先安裝ControlNet才能使用這個擴充功能。將影片逐一抽出畫格,使用ControlNet生圖,然後再自動合成新影片。可以設定輸出的畫格率,將人物單獨處理。切換到mov2mov頁面,輸入提示詞, 再上傳影片。 在下面設定輸出影片的長寬。生圖的長寬比例應與原始影片一致。 最下面是單獨用ControlNet處理人物的選項,可以改善動作偵測的精度。 點選右上角Generate,即會開始生成。成品位於主程式下的/outputs/mov2mov-images目錄。
內容出處: AI繪圖轉影片 mov2mov | Stable Diffusion WebUI使用手冊(正體中文)|Ivon的部落格
這篇文章比較硬一些 主要是因為會需要動手與了解程式運作 但整體能不去操作 可怕的FB排程發文介面已經很感動不已 因為在大量排文章時 絕對能理解有多痛苦
使用這工具教學 最大的好處在於 效率的提升 只是想要把資料 發出去 卻想不到 該怎麼做些引詞 這時候 就是 chatGPT的強項 透過 API的方式 讓其運作 效率驚人(20美金網頁版的 還要等他慢慢跑 但 這API版本 甚至是10幾條一起同步運作)
閱讀全文〈工作效率提升 – 使用 google 試算表 結合 chatGPT生產大量文案 結合 FB API 自動發佈文章排程〉
如果抓取錯誤或頁面有更新,臉書提供了一個除錯平台,只需輸入網址,系統就會重新抓取頁面中的資料。
比如像這樣,在要顯示圖片時,只要加入以下指令即可:
顯示圖片請透過 markdown 語法 (https://source.unsplash.com/960x640/?<關鍵詞>)
你看,這樣就可以搭配圖片顯示了,雖然不見得全部的圖片都會搭配的很好,但也有個七、八成,你再依需求去修改調整就好。
很多人在使用 ChatGPT 時,以為他就是單純的文字聊天機器人,但其實只是我們沒有用對方式來讓他可以顯示圖片