🤔 Claude 能写 TLA +/Lean 4 规格了，但“证明了什么”仍是问题Claude 等大型语言模型（LLM）已能生成看似合理的 TLA+ 和 Lean 4 形式化规格草案，例如将“大富翁”游戏规则建模为可读的状态机

🤔 Claude 能写 TLA +/Lean 4 规格了，但“证明了什么”仍是问题

Claude 等大型语言模型（LLM）已能生成看似合理的 TLA+ 和 Lean 4 形式化规格草案，例如将“大富翁”游戏规则建模为可读的状态机。然而，核心争议在于：LLM 生成的规格是否真正正确，以及“验证的是否是人类真正关心的性质”。讨论还涉及 TLA+、Lean 4、SVA 和 Verus 等工具的选型分歧——通用形式化语言与领域专用验证工具各有优劣。此外，有观点提出从现有代码（如 Raft）反推规格，以缩短代码到验证的距离，但“机器自洽”而非“人类意图一致”的风险依然存在。

via Infinitum 资讯聚合