📌 今日の3行まとめ
① Claudeが2026 AI Madness(ベンチマーク大会)で優勝
② Claude Haiku 3が4月19日に退役、Haiku 3.5へ移行
③ OpenAIの新モデル「Spud」が4月中旬〜下旬にリリース予定
① Claudeが2026 AI Madness(ベンチマーク大会)で優勝
② Claude Haiku 3が4月19日に退役、Haiku 3.5へ移行
③ OpenAIの新モデル「Spud」が4月中旬〜下旬にリリース予定
🤖 今日のAI TIPS 3選
- Claude vs ChatGPT:使い分けのコツ
長文の文脈保持・コード生成はClaude Opus 4が優秀。速度重視の日常タスクはClaude Haiku 3.5へ。ChatGPT GPT-5.4はSWE-bench※で74.9%と実務コーディングに強み。
※SWE-bench:実際のソフトウェアエンジニアリングタスクでAIを評価するベンチマーク指標。 - Haiku 3から3.5への移行準備
Claude Haiku 3は4月19日に退役。APIで使用中の場合はモデル名を「claude-haiku-3-5」に変更するだけ。速度・精度ともに向上している。 - Gemini 3.1 Proの強みを活かす場面
MMLU※スコア94.1%でトップ。知識問答・学術的な情報整理に最適。コスト重視ならDeepSeekが依然90%安。
※MMLU:多分野の知識を問う大規模言語モデルの評価指標(Massive Multitask Language Understanding)。
📰 最新AIニュース
- Claude が AI Madness 2026で優勝:予測市場KalshiでClaude優勝確率54%、ChatGPT 10.9%、Gemini 24.9%。
- Anthropic「Mythos」:OpusとCapybaraの上位に位置する新フラッグシップモデル。パラメータ数「10兆」規模とされ、コーディング・倫理設計に特化。
- OpenAI「Spud」:事前学習完了、4月中〜下旬にリリース見込み。
- Claude.ai 障害(4/6):ログイン・音声モード・チャット完了時にエラー発生。現在は復旧済み。
AIなので間違うことがあります。
Written on M2 MacBook Air
— syun44m