AI写作测试++

测试不同的大模型写作能力,武侠小说的场景写作,很意外:文笔最好、故事最完整、可读性最强的居然是法国的mistral-small-3.1和加拿大的command-r-08-2024这俩二线大模型;qwen2.5、deepseek-v3也还行,gemini-2-flash、grok-3凑合能看;llama-3.3一如即往的中文很烂,gpt和claude直接无法输出……

这些模型通过7个平台进行的对话
mistral是法国的,command是加拿大的,qwen、deepeek是中国的,gemini、grok、llama、gpt、claude是美国的。
其中grok是弱审查,gpt和claude是强审查,其它一般都是中度审查,同时不同国家的审查重点不同

基本判断:

  1. 中文语料越多,中文写作水平越高
  2. 内容审查越少,写作空间越大
  3. 写作能力和这些大模型发布的时间先后负相关
  4. 不同平台相同大模型的输出差不多
  5. 文科专业毕业生以及相关白领工作,以后职业前景堪忧