此为历史版本和 IPFS 入口查阅区,回到作品页
bargisula
IPFS 指纹 这是什么

作品指纹

兵棋系統2026/1/3

bargisula
·
·
大躍進

跨年時的更新,更出一個我意料外的方向。

蒙地卡羅一直是我程式核心,不論是攻擊方式,事件頻率等,其實都是透過蒙地卡羅來模擬可能情形,但當我直接問gemini,open ai,如何可以將現在的專案提升檔次,跑出一個我意料外的答案,優化器。

台海問題,我一直在做的是模擬器,就是給定事件機率,模擬各種可能狀況,理論上會有收斂情形,但是台海有一種常見問題,是模擬器無法說明的,如“台灣要撐過14天,則一兆軍費應該投資在那邊”,這種問題其實要知道如何攻台,而這個不是模擬器可以回答。

此外,蒙地卡羅是各個回合隨機,這個跟現實差異太遠,中國不太可能第一回合登陸,第二回合撤軍,第三回合發飛彈...這個是有連續性,也有領導風格在內要考量。

結果,跑出一個強化學習及雙腦結構,已經不是只有蒙地卡羅,而是真的走到機器學習,我當時愣了一下,我沒有想過怎麼走到這裡,但是我還是跟claude討論一下,因為不同LLM看法不同,claude認為可以用替代方案,不用直接走到訓練,我是建議折衷方式,但是還是優化目前的程式碼,先不走訓練。

其實走到優化器已經跟原始目的不太一樣,確認高出不只一個檔次,相較下蒙地卡羅只是一個簡單的模擬器,模擬可能成果,雖然在這過程也獲得很多,不管是軍事,台海,或是程式設計概念,如何去思考,怎麼跟LLM討論,怎麼看待討論結果...

我認為我在這方面真的成長很多,可能是我從白板上來,特別有感覺吧,但也不可諱言,隨著專案發展,我也有點控制不住專案的感覺,因為真的東西越來越多,好處想是越來專業化,但是缺點是,我已經有點無法控制是否真的有執行,曾經發生寫了程式,但是主程式並沒有呼叫的窘境,還好看了結果越看越怪,然後請LLM發展檢查程式,才進行修正。

但我應該要知道,這個是要訓練我對專案的進度控制,不能一直放任無限制開發,我還是有目標在進行,不用太大目標,但是每天一點點進度,我還是可以認可我自己,也可以提出令我階段滿意的成果。

CC BY-NC-ND 4.0 授权