兵棋系統2026/1/3
這是一個有挫折但也有成長的過程。
當系統逐步擴大,其實有些程式是否執行,是否合理,更新後是否影響其他程式,這是最困難的地方,所以有一段時間是在debug,不斷猜測更新後會影響那支程式,為什麼會跑出這樣結果。
這個是走入AI訓練+雙腦的第一個結果,因為在兵棋系統上,第一個會問的就是"會如何",所以用蒙地卡羅是很直觀,可以知道各種事件結果(當然要主觀加入參數就是),但看到結果後(也會看到結果的建議),就會開始問,"如果我OOO,是否XXXX",這個是優化器(給定目標、限制,不斷自動調整參數找出答案),此外,現實中每個回合不是隨機的,尤其有新的參數後,對手也不是稻草人,也會調整(用新參數+對手也會因應調整,所以要加入訓練模式)
這是新的階段,也有點出乎我料外的結果,沒有想到會走到這裡。當然每個階段都有需要有優化的地方(要加入限制,最佳解其實是球最大分數,但如果只是追求最大分數可能第一步就是丟出核武這種行為,所以需要有限制;雙腦也可能走到很奇怪的結局,雙方都不動,因為這樣是均衡解,但也可能沒有均衡解,所以還是要人工介入判斷)
從蒙地卡羅建模,學知識->系統規劃->AI溝通(建構/程式/檢查)->進一步優化,演變到單一問題->怎麼調->加入對手考量,逐漸走向現實化,大幅提高兵器系統價值,對我來說有點->線->面擴充的感覺,彷彿是大霹靂般,從一個奇點,突然間擴充到一個立體世界,這種過程深深刺激了我,也讓我更想知道下一步可能會走去哪邊。