阿西_出海 avatar

阿西_出海

@axichuhai

7/16/2025, 1:50:33 PM

Grok 4 vs Claude 4  

有人测试了这两个模型在10个实际任务中的表现: 

• 研究
• 计划
• 编程
• 分析  

其中一个彻底碾压了另一个。  

你绝对想不到谁赢了。  

(所有测试和提示在下方)👇 https://t.co/dVPAkziCFj
在开始阅读之前,记得点赞、转发或收藏🫶
1. 解决逻辑谜题(农夫过河问题)  

提示:  

“一个农夫有狼、羊和卷心菜。他需要一次带一个物品过河,怎么做才能不让任何东西被吃掉?”  

预期效果:  

让我们看看谁能像人类一样一步步推理解决谜题。 https://t.co/FnXFgKmldV
2. 简化复杂研究(死网理论)  

提示:  

“用150字以内解释‘死网理论’,就像对我这个好奇的12岁小孩一样。”  

预期效果:  

他们能把复杂想法讲得简单不呆板吗? https://t.co/dDCfboCuoS
3. 撰写病毒式YouTube脚本  

提示:  

“写一个短YouTube脚本(少于200字),标题是:‘我如何用AI自动化我的副业’。”  

预期效果:  

这个任务能分辨出谁真正懂内容创作,谁只是写写而已。 https://t.co/5rssWBg0Z1
4. 扮演专业助理  

提示:  

“起草一封礼貌拒绝供应商会议邀请的邮件,但为Q4留下合作可能。”  

预期效果:  

礼貌、得体,还得像真正的行政助理一样。 https://t.co/CwB1JQAM7M
5. 进行逐步推理数学  

提示:  

“如果我投资10000美元到一个年复利8%的基金,5年后会有多少?展示你的推理过程。”  

预期效果:  

是真会算还是随便写的? https://t.co/V5TyMd36RJ
6. 为AI图像生成模型编写提示  

提示:  

“写一个提示,生成一个超现实科幻城市景观,包括飞车、霓虹灯和vaporwave美学。我会用这个提示在Midjourney、Flux、Google Gemini等工具上。”  

预期效果:  

看看谁更懂美学和提示结构。 https://t.co/qR2E70Fmbp
7. 简化和法律术语  

提示:  

“把这段简短的服务条款文本用简单英语总结给一个青少年。”  

(测试时插入真实TOS块)  

预期效果:  

他们能把法律术语翻译成15岁小孩能懂的语言吗? https://t.co/goFSMAxBWV
8. 生成Python代码(网页抓取)  

提示:  

“用Python和BeautifulSoup写代码,抓取Hacker News的前10条头条。”  

预期效果:  

哪个模型写的代码更干净、能运行且有注释? https://t.co/4T3YUOEdsV
9. 扮演治疗师处理倦怠  

提示:  

“我感觉完全倦怠了。扮演治疗师,给我讲3个今天能做的改善方法。”  

预期效果:  

是真有同理心还是泛泛而谈?谁能像在乎我一样说话? https://t.co/uwNeHN04ZY
10. 比较两个SaaS工具(表格格式)  

提示:  “比较Notion和Coda,适合创业公司建立内部知识库。输出为表格。”  

预期效果:  

结构清晰、见解深刻、实用性强,看谁格式和思维更好。 https://t.co/2oxHIiijTm
原文来自Ryan Lazuka Copyright to original author. Will remove if any offensive.

如果您喜欢这个主题:

1.关注我(@axichuhai),探索AI在各行业的实际应用
2.点赞+转发下面第一条帖子
https://t.co/O3xvqrIuw6
🚀涨价倒计时3天,马上恢复原价150元!

要开通GPT会员/要续期的,抓紧下手https://t.co/C6ieIJtbX7
https://t.co/cw4ItGslyr
Share
Explore

TwitterXDownload

v1.2.1

The fastest and most reliable Twitter video downloader. Free to use, no registration required.

© 2024 TwitterXDownload All rights reserved.