兵棋系統2026/1/10

bargisula

1 月 9 日

IPFS

進入到ai training，雙腦結構

一、今日修正項目

1. 訓練環境修正（env_wrapper.py）

移除假戰鬥邏輯：刪除固定扣 2 點戰力的簡化計算
調用真實引擎：完全使用 engine.py 的戰鬥邏輯，包含節點系統、事件觸發、領導風格
藍軍策略實現：透過修改 config 參數（resilience、air_defense、energy、training）而非直接加血

2. 訓練流程優化（train_dual_brain.py）

訓練輪數：2000 輪（測試）→ 可擴展至 10000 輪
參數衰減：epsilon 和 learning rate 線性衰減（0.3→0.05）
混合訓練：30% 紅軍訓練 + 30% 藍軍訓練 + 40% 自由對打
評估系統：每 500 輪測試 100 場，追蹤勝率和策略分布

3. 參數優化器修正（grid_search.py）

參數範圍對齊實際配置
成本計算參考真實軍購（愛國者、F-16V、能源儲備）
蒙地卡羅次數：100→500 次，加入標準差分析

4. 核心邏輯修正

能源系統（warfare_channels.py）

改為百分比衰減：每次攻擊最多降低 20% 當前能源
民心條件調整：只有能源 0-5 天才扣民心，≤0 時不扣

撤軍機制（escalation.py）

分級撤軍：50% 損失必定撤、40% 損失撤軍、30% 損失+美軍跡象撤軍
提高台灣生存機會

中國損失公式（warfare_channels.py + engine.py）

關鍵修正：中國損失 = 基礎殺傷 × 台灣戰力比例 × 防禦完整度
讓投資效益可見：防空 1.5 倍 → 多殺 50%
讓戰況影響結果：台灣戰力歸零 → 殺傷降至 30%

二、測試結論

修正前問題

台灣只能撐 4-5 天，無論投資多少
存活率 90-100%（中國必定撤軍）
投資完全無效（0億 = 2680億）

修正後成果

快速測試（50 次/組）：

標準配置（0億）：15% 存活
70%攔截+重防空（1070億）：95% 存活
投資效益明確化

AI 訓練結果（2000 輪）：

紅藍勝率：42% vs 57%（接近平衡）
紅軍主流：封鎖+外線阻援（60%）
藍軍主流：AIR_DEFENSE（40%）
策略博弈成立，AI 學會投資防空

策略對應關係：

紅軍封鎖戰 → 藍軍 AIR_DEFENSE（防空優先）紅軍登陸戰 → 藍軍 ENERGY_STOCK（能源儲備）紅軍首戰速決 → 藍軍 STANDARD（基礎配置）

三、重要提醒

⚠️ 本結論僅供參考，實際結果會因以下參數而大幅變動：

撤軍門檻：當前 40% 損失即撤軍，若改為 50% 則台灣更難撐
能源衰減率：當前 20%/次，若改為 30% 則能源更快耗盡
中國損失公式係數：影響投資回報率和撤軍時機
初始參數：台灣戰力 400、能源 20 天，改變則全盤影響
領導風格機率：謹慎型/強硬型/賭徒型分布影響攻擊模式選擇

本系統為模擬框架，非預測工具。所有數值設定基於假設，真實戰況涉及無數不可量化變數（政治決策、國際介入時機、士氣、天候、情報戰等）。使用時應將其視為策略思考輔助工具而非預測結果。

CC BY-NC-ND 4.0 授权

喜欢我的作品吗？别忘了给予支持与赞赏，让我知道在创作的路上有你陪伴，一起延续这份热忱！