Grok 4 vs Claude 4
有人测试了这两个模型在10个实际任务中的表现:
• 研究
• 计划
• 编程
• 分析
其中一个彻底碾压了另一个。
你绝对想不到谁赢了。
(所有测试和提示在下方)👇 https://t.co/dVPAkziCFj

在开始阅读之前,记得点赞、转发或收藏🫶
1. 解决逻辑谜题(农夫过河问题)
提示:
“一个农夫有狼、羊和卷心菜。他需要一次带一个物品过河,怎么做才能不让任何东西被吃掉?”
预期效果:
让我们看看谁能像人类一样一步步推理解决谜题。 https://t.co/FnXFgKmldV
2. 简化复杂研究(死网理论)
提示:
“用150字以内解释‘死网理论’,就像对我这个好奇的12岁小孩一样。”
预期效果:
他们能把复杂想法讲得简单不呆板吗? https://t.co/dDCfboCuoS
3. 撰写病毒式YouTube脚本
提示:
“写一个短YouTube脚本(少于200字),标题是:‘我如何用AI自动化我的副业’。”
预期效果:
这个任务能分辨出谁真正懂内容创作,谁只是写写而已。 https://t.co/5rssWBg0Z1
4. 扮演专业助理
提示:
“起草一封礼貌拒绝供应商会议邀请的邮件,但为Q4留下合作可能。”
预期效果:
礼貌、得体,还得像真正的行政助理一样。 https://t.co/CwB1JQAM7M
5. 进行逐步推理数学
提示:
“如果我投资10000美元到一个年复利8%的基金,5年后会有多少?展示你的推理过程。”
预期效果:
是真会算还是随便写的? https://t.co/V5TyMd36RJ
6. 为AI图像生成模型编写提示
提示:
“写一个提示,生成一个超现实科幻城市景观,包括飞车、霓虹灯和vaporwave美学。我会用这个提示在Midjourney、Flux、Google Gemini等工具上。”
预期效果:
看看谁更懂美学和提示结构。 https://t.co/qR2E70Fmbp
7. 简化和法律术语
提示:
“把这段简短的服务条款文本用简单英语总结给一个青少年。”
(测试时插入真实TOS块)
预期效果:
他们能把法律术语翻译成15岁小孩能懂的语言吗? https://t.co/goFSMAxBWV
8. 生成Python代码(网页抓取)
提示:
“用Python和BeautifulSoup写代码,抓取Hacker News的前10条头条。”
预期效果:
哪个模型写的代码更干净、能运行且有注释? https://t.co/4T3YUOEdsV
9. 扮演治疗师处理倦怠
提示:
“我感觉完全倦怠了。扮演治疗师,给我讲3个今天能做的改善方法。”
预期效果:
是真有同理心还是泛泛而谈?谁能像在乎我一样说话? https://t.co/uwNeHN04ZY
10. 比较两个SaaS工具(表格格式)
提示: “比较Notion和Coda,适合创业公司建立内部知识库。输出为表格。”
预期效果:
结构清晰、见解深刻、实用性强,看谁格式和思维更好。 https://t.co/2oxHIiijTm

原文来自Ryan Lazuka Copyright to original author. Will remove if any offensive.
如果您喜欢这个主题:
1.关注我(@axichuhai),探索AI在各行业的实际应用
2.点赞+转发下面第一条帖子
https://t.co/O3xvqrIuw6
🚀涨价倒计时3天,马上恢复原价150元!
要开通GPT会员/要续期的,抓紧下手https://t.co/C6ieIJtbX7
https://t.co/cw4ItGslyr