🤔 Claude 能写 TLA +/Lean 4 规格了,但“证明了什么”仍是问题
Claude 等大型语言模型(LLM)已能生成看似合理的 TLA+ 和 Lean 4 形式化规格草案,例如将“大富翁”游戏规则建模为可读的状态机。然而,核心争议在于:LLM 生成的规格是否真正正确,以及“验证的是否是人类真正关心的性质”。讨论还涉及 TLA+、Lean 4、SVA 和 Verus 等工具的选型分歧——通用形式化语言与领域专用验证工具各有优劣。此外,有观点提出从现有代码(如 Raft)反推规格,以缩短代码到验证的距离,但“机器自洽”而非“人类意图一致”的风险依然存在。
via Infinitum 资讯聚合
Claude 等大型语言模型(LLM)已能生成看似合理的 TLA+ 和 Lean 4 形式化规格草案,例如将“大富翁”游戏规则建模为可读的状态机。然而,核心争议在于:LLM 生成的规格是否真正正确,以及“验证的是否是人类真正关心的性质”。讨论还涉及 TLA+、Lean 4、SVA 和 Verus 等工具的选型分歧——通用形式化语言与领域专用验证工具各有优劣。此外,有观点提出从现有代码(如 Raft)反推规格,以缩短代码到验证的距离,但“机器自洽”而非“人类意图一致”的风险依然存在。
via Infinitum 资讯聚合