兵棋系統2026/1/10
一、今日修正項目
1. 訓練環境修正(env_wrapper.py)
移除假戰鬥邏輯:刪除固定扣 2 點戰力的簡化計算
調用真實引擎:完全使用 engine.py 的戰鬥邏輯,包含節點系統、事件觸發、領導風格
藍軍策略實現:透過修改 config 參數(resilience、air_defense、energy、training)而非直接加血
2. 訓練流程優化(train_dual_brain.py)
訓練輪數:2000 輪(測試)→ 可擴展至 10000 輪
參數衰減:epsilon 和 learning rate 線性衰減(0.3→0.05)
混合訓練:30% 紅軍訓練 + 30% 藍軍訓練 + 40% 自由對打
評估系統:每 500 輪測試 100 場,追蹤勝率和策略分布
3. 參數優化器修正(grid_search.py)
參數範圍對齊實際配置
成本計算參考真實軍購(愛國者、F-16V、能源儲備)
蒙地卡羅次數:100→500 次,加入標準差分析
4. 核心邏輯修正
能源系統(warfare_channels.py)
改為百分比衰減:每次攻擊最多降低 20% 當前能源
民心條件調整:只有能源 0-5 天才扣民心,≤0 時不扣
撤軍機制(escalation.py)
分級撤軍:50% 損失必定撤、40% 損失撤軍、30% 損失+美軍跡象撤軍
提高台灣生存機會
中國損失公式(warfare_channels.py + engine.py)
關鍵修正:中國損失 = 基礎殺傷 × 台灣戰力比例 × 防禦完整度
讓投資效益可見:防空 1.5 倍 → 多殺 50%
讓戰況影響結果:台灣戰力歸零 → 殺傷降至 30%
二、測試結論
修正前問題
台灣只能撐 4-5 天,無論投資多少
存活率 90-100%(中國必定撤軍)
投資完全無效(0億 = 2680億)
修正後成果
快速測試(50 次/組):
標準配置(0億):15% 存活
70%攔截+重防空(1070億):95% 存活
投資效益明確化
AI 訓練結果(2000 輪):
紅藍勝率:42% vs 57%(接近平衡)
紅軍主流:封鎖+外線阻援(60%)
藍軍主流:AIR_DEFENSE(40%)
策略博弈成立,AI 學會投資防空
策略對應關係:
紅軍封鎖戰 → 藍軍 AIR_DEFENSE(防空優先)紅軍登陸戰 → 藍軍 ENERGY_STOCK(能源儲備)紅軍首戰速決 → 藍軍 STANDARD(基礎配置)三、重要提醒
⚠️ 本結論僅供參考,實際結果會因以下參數而大幅變動:
撤軍門檻:當前 40% 損失即撤軍,若改為 50% 則台灣更難撐
能源衰減率:當前 20%/次,若改為 30% 則能源更快耗盡
中國損失公式係數:影響投資回報率和撤軍時機
初始參數:台灣戰力 400、能源 20 天,改變則全盤影響
領導風格機率:謹慎型/強硬型/賭徒型分布影響攻擊模式選擇
本系統為模擬框架,非預測工具。所有數值設定基於假設,真實戰況涉及無數不可量化變數(政治決策、國際介入時機、士氣、天候、情報戰等)。使用時應將其視為策略思考輔助工具而非預測結果。
喜欢我的作品吗?别忘了给予支持与赞赏,让我知道在创作的路上有你陪伴,一起延续这份热忱!