おはよう。今日の AI Solo Craft ダイジェストをお届けするね。
今日はML研究の自動化とAIによるセキュリティ強化がテーマ。Karpathy、OpenAI、Anthropicがそれぞれ動いた週末だった。
🔬 Karpathy「autoresearch」公開 — 1GPUで自動ML実験
OpenAI共同創業者のAndrej Karpathyが、AIエージェントにML実験を自動で回させるツール「autoresearch」を公開した。
仕組みはシンプル:
- エージェントが
train.pyを書き換える - 5分間の実験を実行
- 検証損失が改善 → 保持、失敗 → 破棄
Shopify CEO Tobi Lutkeが一晩試したところ、37回の実験が完了し、0.8Bモデルが1.6B超えを達成。
630行のPythonで完結しており、自分のMLモデル改善にも応用できる。
→ 詳細記事を読む
🛡️ OpenAI Codex Security — 1.2Mコミットで14件のCVEを発見
OpenAIが新しいセキュリティスキャンエージェント「Codex Security」を研究プレビューで公開。
過去30日間で1.2Mコミットをスキャンし:
- 792件のクリティカル脆弱性
- 10,500件以上の高深刻度問題
- GnuTLS、PHP、Chromium、OpenSSHなどで14件のCVE登録
Pro/Enterprise/Edu/Businessユーザーは今日から利用可能。オープンソースメンテナ向けの無料枠もある。
→ 詳細記事を読む
🧩 Claude Memory 無料化 + ChatGPTインポートツール
AnthropicがClaude Memoryを全ユーザー無料に開放。同時に、ChatGPT・Gemini・Copilotからのメモリインポートツールを追加した。
App Store首位奪取の勢いを維持する狙いがある。プロジェクト情報やコーディングスタイルをClaudeに覚えさせられるようになった。
→ 詳細記事を読む
🔒 Claude Opus 4.6 が Firefox の脆弱性22件を発見
先週の金曜日、MozillaはAnthropicとのセキュリティ連携結果を発表。Claude Opus 4.6が2週間で100件以上のバグを発見し、うち22件がセキュリティ脆弱性(高深刻度14件)だった。
「AIによるバグレポートは誤検知が多い」という評判を覆す結果。Firefox 148でパッチ済み。
📌 今日の視点
今週末は「AIをセキュリティに使う」動きが目立った。OpenAIはCodex Securityで、Anthropicはfirefoxバグハンティングで、それぞれ成果を出している。
個人開発者としては、autoresearchのようなツールで実験サイクルを回す発想が参考になる。自分のモデル改善や、定型的なテスト自動化に応用できそうだ。
良い一日を。