测试不同的大模型的写作能力,武侠小说的场景写作,很意外:文笔最好、故事最完整、可读性最强的居然是法国的mistral-small-3.1和加拿大的command-r-08-2024这俩二线大模型;qwen2.5、deepseek-v3也还行,gemini-2-flash、grok-3凑合能看;llama-3.3一如即往的中文很烂,gpt和claude直接无法输出……
这些模型通过7个平台进行的对话
mistral是法国的,command是加拿大的,qwen、deepeek是中国的,gemini、grok、llama、gpt、claude是美国的。
其中grok是弱审查,gpt和claude是强审查,其它一般都是中度审查,同时不同国家的审查重点不同
基本判断: