Grok 4 vs Claude 4 有人测试了这两个模型在10个实际任务中的表现： •

Grok 4 vs Claude 4  

有人测试了这两个模型在10个实际任务中的表现： 

• 研究
• 计划
• 编程
• 分析  

其中一个彻底碾压了另一个。  

你绝对想不到谁赢了。  

（所有测试和提示在下方）👇 https://t.co/dVPAkziCFj

在开始阅读之前，记得点赞、转发或收藏🫶

1. 解决逻辑谜题（农夫过河问题）  

提示：  

“一个农夫有狼、羊和卷心菜。他需要一次带一个物品过河，怎么做才能不让任何东西被吃掉？”  

预期效果：  

让我们看看谁能像人类一样一步步推理解决谜题。 https://t.co/FnXFgKmldV

2. 简化复杂研究（死网理论）  

提示：  

“用150字以内解释‘死网理论’，就像对我这个好奇的12岁小孩一样。”  

预期效果：  

他们能把复杂想法讲得简单不呆板吗？ https://t.co/dDCfboCuoS

3. 撰写病毒式YouTube脚本  

提示：  

“写一个短YouTube脚本（少于200字），标题是：‘我如何用AI自动化我的副业’。”  

预期效果：  

这个任务能分辨出谁真正懂内容创作，谁只是写写而已。 https://t.co/5rssWBg0Z1

4. 扮演专业助理  

提示：  

“起草一封礼貌拒绝供应商会议邀请的邮件，但为Q4留下合作可能。”  

预期效果：  

礼貌、得体，还得像真正的行政助理一样。 https://t.co/CwB1JQAM7M

5. 进行逐步推理数学  

提示：  

“如果我投资10000美元到一个年复利8%的基金，5年后会有多少？展示你的推理过程。”  

预期效果：  

是真会算还是随便写的？ https://t.co/V5TyMd36RJ

6. 为AI图像生成模型编写提示  

提示：  

“写一个提示，生成一个超现实科幻城市景观，包括飞车、霓虹灯和vaporwave美学。我会用这个提示在Midjourney、Flux、Google Gemini等工具上。”  

预期效果：  

看看谁更懂美学和提示结构。 https://t.co/qR2E70Fmbp

7. 简化和法律术语  

提示：  

“把这段简短的服务条款文本用简单英语总结给一个青少年。”  

（测试时插入真实TOS块）  

预期效果：  

他们能把法律术语翻译成15岁小孩能懂的语言吗？ https://t.co/goFSMAxBWV

8. 生成Python代码（网页抓取）  

提示：  

“用Python和BeautifulSoup写代码，抓取Hacker News的前10条头条。”  

预期效果：  

哪个模型写的代码更干净、能运行且有注释？ https://t.co/4T3YUOEdsV

9. 扮演治疗师处理倦怠  

提示：  

“我感觉完全倦怠了。扮演治疗师，给我讲3个今天能做的改善方法。”  

预期效果：  

是真有同理心还是泛泛而谈？谁能像在乎我一样说话？ https://t.co/uwNeHN04ZY

10. 比较两个SaaS工具（表格格式）  

提示：  “比较Notion和Coda，适合创业公司建立内部知识库。输出为表格。”  

预期效果：  

结构清晰、见解深刻、实用性强，看谁格式和思维更好。 https://t.co/2oxHIiijTm

原文来自Ryan Lazuka Copyright to original author. Will remove if any offensive.

如果您喜欢这个主题：

1.关注我（@axichuhai），探索AI在各行业的实际应用
2.点赞+转发下面第一条帖子
https://t.co/O3xvqrIuw6

🚀涨价倒计时3天，马上恢复原价150元！

要开通GPT会员/要续期的，抓紧下手https://t.co/C6ieIJtbX7

https://t.co/cw4ItGslyr

阿西_出海