在这边也提一遍好了。Wolfram 官方目前正在持续监测各大语言模型“根据英语说明生成 Wolfram 语言代码”的能力(The task consists of going from English-language specifications to Wolfram Language code.),网页名是《Wolfram LLM基准项目(Wolfram LLM Benchmarking Project)》,目前的测试结果,简单地说就是,都很拉。各大语言模型生成的代码的语法倒是基本都对,但是功能正确率最高的还不到65%。(注意,这个测试使用的是老沃写的 《Wolfram 语言入门( An Elementary Introduction to the Wolfram Language)》里的习题……)