兵棋系統2026/1/3

bargisula

1 月 2 日

大躍進

跨年時的更新，更出一個我意料外的方向。

蒙地卡羅一直是我程式核心，不論是攻擊方式，事件頻率等，其實都是透過蒙地卡羅來模擬可能情形，但當我直接問gemini,open ai,如何可以將現在的專案提升檔次，跑出一個我意料外的答案，優化器。

台海問題，我一直在做的是模擬器，就是給定事件機率，模擬各種可能狀況，理論上會有收斂情形，但是台海有一種常見問題，是模擬器無法說明的，如“台灣要撐過14天，則一兆軍費應該投資在那邊”，這種問題其實要知道如何攻台，而這個不是模擬器可以回答。

此外，蒙地卡羅是各個回合隨機，這個跟現實差異太遠，中國不太可能第一回合登陸，第二回合撤軍，第三回合發飛彈...這個是有連續性，也有領導風格在內要考量。

結果，跑出一個強化學習及雙腦結構，已經不是只有蒙地卡羅，而是真的走到機器學習，我當時愣了一下，我沒有想過怎麼走到這裡，但是我還是跟claude討論一下，因為不同LLM看法不同，claude認為可以用替代方案，不用直接走到訓練，我是建議折衷方式，但是還是優化目前的程式碼，先不走訓練。

其實走到優化器已經跟原始目的不太一樣，確認高出不只一個檔次，相較下蒙地卡羅只是一個簡單的模擬器，模擬可能成果，雖然在這過程也獲得很多，不管是軍事，台海，或是程式設計概念，如何去思考，怎麼跟LLM討論，怎麼看待討論結果...

我認為我在這方面真的成長很多，可能是我從白板上來，特別有感覺吧，但也不可諱言，隨著專案發展，我也有點控制不住專案的感覺，因為真的東西越來越多，好處想是越來專業化，但是缺點是，我已經有點無法控制是否真的有執行，曾經發生寫了程式，但是主程式並沒有呼叫的窘境，還好看了結果越看越怪，然後請LLM發展檢查程式，才進行修正。

但我應該要知道，這個是要訓練我對專案的進度控制，不能一直放任無限制開發，我還是有目標在進行，不用太大目標，但是每天一點點進度，我還是可以認可我自己，也可以提出令我階段滿意的成果。

CC BY-NC-ND 4.0 授权