📰 ニュース
AGENTS.mdファイルがAIコーディングエージェントの効率を高める — arXiv論文の知見
リポジトリに置くAGENTS.mdファイルがAIコーディングエージェントの試行錯誤を減らしタスク完了率を向上させることを示した研究。Cursor 3のような並列エージェント時代に直接効いてくる知見。
Microsoft、完全自社製AIモデル3本を公開 — MAI-Transcribe-1、MAI-Voice-1、MAI-Image-2
MicrosoftがOpenAI依存からの脱却を示す自社AIモデル3本をMicrosoft FoundryとMAI Playgroundで公開。音声認識・音声生成・画像生成をカバーする。
Cursor 3 リリース — 複数のAIエージェントを並列で走らせる「Agents Window」登場
Cursor 3がリリース。エージェントをローカル・クラウド・リモートSSHで並列管理するAgents Windowと、UIを直接クリックして指示するDesign Modeが追加された。
「兄弟リポジトリ参照」でモノレポ化せずにAIコーディングエージェントの文脈を拡張する — Kenn Ejimaの実践テクニック
Gista創設者のKenn Ejimaが紹介した、../other-repoとrg --filesで兄弟リポジトリを参照させるテクニック。モノレポにできない事情があってもAIエージェントにクロスリポジトリの文脈を与える実践的な方法を解説する。
【論文】AGENTS.mdはAIコーディングエージェントの効率をどう変えるか
AGENTS.mdファイルがCodexやClaude Codeなどのエージェント効率に与える影響を実証的に分析した論文を解説。個人開発者のリポジトリ設計への示唆。
Microsoft Copilot Researcher、GPTとClaudeを同時に使う「Critique」を一般提供開始
Microsoft 365 Copilotの研究エージェント「Researcher」が、OpenAIとAnthropicの複数モデルを同時活用する「Critique」機能を追加。マルチモデル時代の開発ワークフローへの示唆。
AIコードレビューエージェントの実力を測る — Code Review Agent Benchmark 論文解説
AIエージェントによるコードレビューの品質を体系的に評価するベンチマークが登場。実際のPRデータでエージェントの指摘精度を測定し、マルチモデル検証の研究基盤を提供する。
Anthropic「Claude for Open Source」— OSSメンテナーに6ヶ月間 Claude Max 20x を無料提供
Anthropicが「Claude for Open Source Program」を正式ローンチ。GitHub Stars 5,000+またはDL数100万+のOSSメンテナーに、月額200ドルのClaude Max 20xを6ヶ月無料で提供する。
Microsoft Copilot がマルチモデル化 — Critique・Council・Cowork の3機能を一斉発表
MicrosoftがCopilot Researcherに「Critique」機能を追加。GPTとClaudeを同時に使い、生成とレビューを分担。Model CouncilやCopilot Coworkも含め、マルチモデルAI時代の到来を開発者向けに解説。
Prompt Master — AIツールごとに最適なプロンプトを自動生成するClaudeスキル
Google Gemini、ChatGPT・Claudeからのチャット履歴・メモリインポート機能を正式提供
Googleが3月のGemini DropでAIチャット履歴とメモリの移行ツールを発表。他プラットフォームからの乗り換えを支援し、無料ユーザーも利用可能。
Google TurboQuant — KVキャッシュ6倍圧縮でローカルLLMの限界を突破
Google Researchが発表したTurboQuantは、LLMのKVキャッシュを3ビットまで量子化し、メモリ6倍削減・精度損失ゼロを実現。追加学習不要で既存モデルに即適用可能。
LLMと開発者のコード品質評価バイアス — AIレビューの盲点を理解する
LLMジャッジと人間の開発者の間でコード品質評価に大きなズレがあることを実証した論文を解説。AIコードレビューの限界と活用法を考える。
Samsung Browser for Windows正式リリース — Perplexity AIアシスタントでブラウジング体験を変える
SamsungがPerplexity AI搭載のブラウザをWindows向けに正式公開。エージェント型AIアシスタントがページ内容を理解し対話する新体験。
GLM-5.1正式公開 — 月額$3でClaude Opus級のコーディング性能を実現
Z.ai(旧Zhipu AI)がGLM-5.1を正式公開。Claude Code上でのコーディングスコア45.3を記録し、Claude Opus 4.6に2.6点差まで迫る。
Stripe Projects登場 — CLIひとつで開発スタックを丸ごと構築する時代へ
Stripeが新CLI「Stripe Projects」をローンチ。Vercel・Supabase・Neon等をプロジェクトに統合し、認証情報の同期やエージェント決済まで実現する。
Claude CodeでWebサイトを丸ごとクローン — AI Website Cloner Templateが話題に
AIエージェントの成果物を「型」で揃える——スキーマ・スキル・Figma MCPの4層テンプレート駆動ガイド
AIエージェントにテンプレートに沿った成果物を安定的に生成させるための実践ガイド。スキーマ定義、スキル設計、Few-shot例示、Figma use_figma連携の4層アプローチを解説。
Anthropic公式:AIに"ダメ出し役"をつけると品質が上がる——GAN着想の3エージェントで長時間自律コーディングを実現
Anthropic LabsがGAN着想のPlanner・Generator・Evaluatorの3エージェント構成を公開。生成と評価を分離し、1行プロンプトから4時間でフルスタックアプリを自律生成。
Claudeモバイルアプリにワークツール統合——Figma・Canva・Amplitudeをスマホから直接操作
AnthropicがClaudeモバイルアプリにワークツール統合を発表。Figmaデザインの確認、Canvaスライド作成、Amplitudeダッシュボードの閲覧がスマートフォンから可能に。
AIコーディングツールのバグ3,800件を分析——Claude Code・Codex・Gemini CLIの弱点が明らかに
Claude Code、Codex、Gemini CLI のGitHub Issueを体系分析した初の実証研究。67%が機能バグ、根本原因の37%がAPI統合エラー
Claude Code Auto Mode登場——「全許可」と「全手動」の間を埋める安全な自律実行
Anthropicが Claude Code に Auto Mode を導入。分類器ベースの安全ゲートでAIコーディングの自律性と安全性を両立
iOS 27でSiriがサードパーティAIチャットボットに対応——ChatGPT以外にClaude、Geminiも利用可能に
AppleがiOS 27でSiriをサードパーティAIサービスに開放する計画が報じられた。WWDC 2026ではCore AI SDKも発表予定
mlx-whisper — Apple Silicon Macの文字起こしを20倍速くする、pip一行の魔法
Apple Silicon Mac向けの文字起こしライブラリmlx-whisperを使えば、通常のWhisperより約20倍高速に音声認識できる。3分の動画を5.4秒で文字起こし。pip install mlx-whisperだけで導入可能。
ユーザー中心主義≠言いなり — Shin氏の1万字論考から読み解く、プロダクト開発で善意が判断放棄に変わる瞬間
「ユーザー中心」と「ユーザーの言いなり」は似て非なるもの。OpenWork CPO室 Shin氏の長文記事を要点抽出。要望は答えではなく手がかり、課題発見はユーザーに近く、解決策設計は作り手の責任。
Renoise — Claude Code × Seedance 2.0で動画広告を「プログラム」する新ツールが登場
商品写真1枚から数百本の動画クリエイティブを自動生成。Claude Codeの推論力とSeedance 2.0の映像生成を組み合わせた「Renoise」が、動画広告制作のパラダイムを変えようとしている。
Storybook MCP for React — AIエージェントがデザインシステムを「知る→作る→直す」フィードバックループを回す
Storybook 10.3で公式リリースされたMCPサーバーアドオン。AIエージェントにコンポーネント情報を渡し、ライブプレビューとセルフヒーリングテストで開発サイクルを自動化する仕組みを解説。
Claude Code Auto Mode — AIが権限判断を自律的に行う新モード、安全性と速度の両立を狙う
Anthropicが Claude Codeに auto mode をプレビュー公開。AIがファイル書き込みやシェル実行の権限を自動判断する。デフォルト設定と全許可の中間に位置する新アプローチ。
LLMの創造性は「見かけほど多様ではない」— 集団的均一化リスクを実証した新研究
LLMは個別の創造性テストで高スコアを取るが、出力全体の多様性は人間よりも著しく低い。ブレインストーミングにAIを使う際の盲点を指摘する研究。
Figma MCPの新ツール「use_figma」でAIエージェントがキャンバスに直接書き込み可能に — オープンベータ開始、始め方完全ガイド
FigmaがMCPサーバーの新ツール「use_figma」をオープンベータで公開。Claude Code、Codex、Cursorなどのエージェントがデザインシステムを活用してFigmaキャンバスに直接書き込みできるように。Skills機能で品質制御も。セットアップ手順から実践的な使い方まで解説。
Claude Codeで20体のAIエージェントを並列稼働 — 動画スクリプト自動生成で累計1,000万ドルの売上を実現した事例
映像プロデューサーMitchellが公開した、Claude Code上で20の専門AIエージェントを並列稼働させ、プロダクトローンチ動画のスクリプトを自動生成するシステム。475万インプレッション超を記録した投稿の全貌を分析する。
【論文】コードエージェントはソフトウェアアーキテクチャを理解しているか?
SWE-benchを超えて、コードエージェントのアーキテクチャ理解度を評価する新フレームワーク。局所修正は得意でも全体設計は苦手な理由に迫る。
Anthropic、Claude Computer UseをMac対応 — スマホから遠隔でPCを操作
Claude CoworkとClaude Codeがmacで直接操作可能に。Pro/Maxプラン限定のリサーチプレビューとして提供開始。
論文解説: AIエージェントの「スキル」パターンがもたらす自動化の安定性
LLMエージェントに再利用可能なスキルを定義することで、組み込み・IoT開発の自動化精度を高める研究。デスクトップ操作AIの信頼性向上にも示唆。
ChatGPT「Library」登場 — ファイルのクラウド保存でセッションを超えた活用が可能に
OpenAIがChatGPTにファイル永続保存機能「Library」をロールアウト。チャットをまたいだファイル参照が可能になった。
Supabase × Cursor 公式プラグイン登場 — DB操作をエージェントに委譲する時代
SupabaseがCursor Marketplaceに公式プラグインを公開。MCP手動設定不要で、エージェントがDB操作を直接実行できるようになった。
Anthropic「Claude Computer Use」正式プレビュー — AIがMacを直接操作する未来が来た
AnthropicがClaude CoworkとClaude Codeに「Computer Use」機能のリサーチプレビューを公開。マウス操作やアプリ起動をAIに任せられる時代の開発者への影響を解説。
Everything Claude Code — 82K★のエージェントハーネス最適化システムを徹底分析
論文解説: VibeContract — バイブコーディングに「品質保証」を組み込む新パラダイム
arXiv論文「VibeContract」を解説。LLMによるコード生成に開発者検証可能な契約(Contract)を組み込み、バイブコーディングの品質を担保するアプローチ。
Claude Cowork「Dispatch」登場 — スマホからPCのAIエージェントを遠隔操作
Anthropicが Claude Cowork に新機能「Dispatch」を追加。スマホから指示を送り、Mac上のCoworkセッションにタスクを実行させられる。
Google「Stitch」β公開 — バイブデザイン時代の幕開け、手書きスケッチを数秒でUIに
Google Labsが AIネイティブUIデザインツール「Stitch」を大幅アップデートしβ公開。自然言語やスケッチからUI生成、DESIGN.md形式でのルール共有、MCP連携に対応。
Claude Dispatch 発表 — スマホからPCのAIエージェントを遠隔操作、「Anthropic版OpenClaw」と評される新機能の全貌
Claude Code開発者が明かすSkills活用の実践知 — Anthropic内部で数百個を運用して見えた9つのカテゴリと設計原則
論文紹介: FormulaCode — AIエージェントはコードベース全体の最適化にどこまで使えるか
957個の実際のパフォーマンスボトルネックで測定。現状のLLMエージェントは大規模リポジトリの複数目的最適化に苦戦する。
Perplexity、AIブラウザ「Comet」のiOS版をリリース — 音声操作・ページ要約・タスク自動化に対応
昨夏Mac版をリリースしたPerplexityが、AIブラウザComet のiPhone版を無料で提供開始。閲覧中のページに対して音声で質問できる。
OpenAI、GPT-5.4 Mini/Nanoをリリース — 開発者の「速くて安い」ニーズに応える軽量モデル
GPT-5.4 miniは2倍以上高速でSWE-Bench Pro 54.4%、nanoはAPI専用で入力$0.20/100万トークン。Codexやサブエージェント活用に最適化。
論文解説: AgentServe — 消費者GPUでAIエージェントを安定稼働させるシステム設計
消費者向けGPU1枚でAIエージェントの複数リクエストを安定処理するAgentServeの論文を解説。CUDAグリーンコンテキストを活用し、TTFT・TPOTを最大2.8倍改善。
1Password Unified Access — AIエージェントの認証情報を一元管理、Cursor・GitHub・Vercelと統合
1PasswordがAIエージェント向けの認証基盤「Unified Access Pro」を発表。Cursor、GitHub、Vercelと連携し、エージェントへのクレデンシャル配信をジャストインタイムで制御する。
NVIDIA NemoClaw — AIエージェントのセキュリティを1コマンドで確保するオープンソーススタック
GTC 2026で発表されたNemoClawは、OpenClawプラットフォーム向けのセキュリティスタック。プライバシールーター、ローカルモデル、ガードレールを1コマンドでインストールできる。
NVIDIA Nemotron 3 Super — 120Bパラメータをローカルで動かすエージェントAI時代の幕開け
GTC 2026で発表されたNemotron 3 Superは120Bパラメータ/12Bアクティブの効率的なオープンモデル。DGX SparkやRTX PRO上でローカル動作し、PinchBenchで85.6%のトップスコアを記録。
AIドリブンデザイン開発の全体像 — 要件定義からユーザビリティテストまで、プロセスはどう変わるか
AIチャットUI/UXの教科書 — 10の観点で整理するベストプラクティスと実装パターン
ログイン失敗をAIチャットで即解決 — Moveworks・Klarna・Intercomに学ぶ7つの先進事例
LLMエージェントの推論コストを半減させる「Ares」— ステップ単位で思考の深さを最適化
LLMエージェントの各ステップで推論レベルを動的調整し、精度を維持しながらトークン消費を最大52.7%削減するフレームワーク「Ares」を解説。
Anthropic、Claudeの利用制限をオフピーク時に2倍に ― 3月27日まで全プランで適用
AnthropicがClaudeの利用制限を3月13日から27日までオフピーク時に2倍に拡大。Free、Pro、Max、Teamプラン全てが対象。
NVIDIA、GTC 2026でNemoClawを発表 ― OpenClawをエンタープライズAIエージェント基盤に
NVIDIAがGTC 2026の基調講演でNemoClawスタックとOpenShellランタイムを発表。OpenClawを企業向けAIエージェントの標準基盤として位置づけた。
21st.dev — 「デザインエンジニアのためのnpm」は個人開発者のUI構築をどう変えるか
Y Combinator支援のオープンソースUIコンポーネントマーケットプレイス「21st.dev」を徹底解説。shadcn/uiベースのReactコンポーネントをワンコマンドで導入でき、AIによるコンポーネント生成機能も搭載。v0.devやshadcn/ui公式との違い、個人開発者にとっての実用価値を分析する。
Remotionだけじゃない!コードで動画を作る6つのライブラリ徹底比較【2026年版】
Codex App Server とは何か — OpenAI が公開した「AIエージェント統合プロトコル」の全貌
NVIDIA GTC 2026キーノート本日開催 — NemoClawとAI推論チップに注目
Jensen Huang CEOのGTC 2026キーノートが本日開催。エンタープライズAIエージェント基盤NemoClawと推論特化チップの発表が見込まれる。
Anthropicがオフピーク時のClaude利用枠を2倍に — 3月27日まで期間限定
Anthropicが3月13日〜27日の期間限定で、Claudeの5時間ローリングリミットをオフピーク時に2倍にするプロモーションを実施中。Free・Pro・Max・Teamプラン全対象。
Claude Codeがこの1ヶ月で「別物」に — /loop・Remote Control・Worktreeなど8つの革新ポイントを整理
Claude Code v2.1.49〜v2.1.76で追加された新機能を包括的に解説。定期監視の/loop、リモート操作、並列開発のWorktree、音声入力など、「放置できる開発環境」を実現する機能群を整理する。
AIが解説する動画の全パターンと支える技術 — VTuberからゆっくり解説まで
GitHub Security Lab、AI脆弱性スキャナー「Taskflow Agent」をOSS公開 — IDOR・認証バイパスを自動検出
GitHub Security LabがAIベースの脆弱性スキャンフレームワーク「Taskflow Agent」をオープンソースで公開。YAML定義のタスクフローでIDOR・認証バイパスなどの高影響度脆弱性を自動検出する。
Anthropic、Claude全モデルで100万トークンコンテキスト窓をGA化 — 追加料金なし
Anthropic がClaude Opus 4.6/Sonnet 4.6の100万トークンコンテキスト窓を一般提供開始。追加料金なしで、コードベース全体や大量ドキュメントの一括処理が可能に。
Claude、会話の中でチャート・ダイアグラムを直接生成する「Imagine with Claude」をベータ公開
Anthropicがclaude.aiにインタラクティブ可視化機能をベータ導入。フローチャート、棒グラフ、マップ、決定木などを会話内で生成・編集できる。
Google Gemini Embedding 2 — テキスト・画像・動画・音声を1つの埋め込み空間に統合するマルチモーダルモデル
Googleがテキスト・画像・動画・音声・PDFを単一の埋め込み空間にマッピングするGemini Embedding 2をPublic Previewで公開。
Replit Agent 4発表 — 並列エージェントと無限デザインキャンバスで開発体験を刷新、$400M調達で評価額$9Bに
Replitが並列AIエージェントと無限デザインキャンバスを搭載したAgent 4を発表。同時に$400Mを調達し評価額$9Bに到達。
WordPress 6.9.2リリース、10件の脆弱性を修正 — 即時アップデート推奨
WordPressがセキュリティパッチ6.9.2をリリース。Blind SSRF、XSS、認可バイパスなど10件の脆弱性を修正。全ユーザーに即時アップデートを推奨
Anthropic Claude Code Review発表、マルチエージェントでPRを自動レビュー
AnthropicがClaude CodeにCode Review機能を追加。複数のAIエージェントが並列でPRをスキャンし、バグを重要度順に報告する
OpenAI GPT-5.4 Thinking公開、ChatGPT for Excelも同時リリース
OpenAIが最新フロンティアモデルGPT-5.4 Thinkingを公開。推論・コーディング・エージェント機能を統合し、同時にChatGPT for Excelもベータ開始
Cursor が JetBrains IDEs に統合 — ACP経由でエージェンティック開発がIDE横断に
AI IDEのCursorがAgent Client Protocol経由でJetBrains IDEsから利用可能に。IntelliJ、PyCharm、WebStorm等で設定不要で使える。
GPT-5.4 が GitHub Copilot で一般提供開始 — マルチステップ推論とエージェンティック機能が強化
OpenAI最新のコーディングモデルGPT-5.4がGitHub Copilotで利用可能に。VS Code、JetBrains、Xcode等全プラットフォーム対応。
Claude Code Review 発表 — AI生成コードのレビューを自動化するマルチエージェントシステム
Anthropicがプルリクエストを自動分析し、論理エラーを検出するCode Review機能を発表。Claude CodeのPR処理ボトルネック解消を狙う。
Claude Memory が全ユーザー無料に — ChatGPT からのメモリ移行ツールも提供開始
AnthropicがClaude Memoryを無料開放し、ChatGPT・Gemini・Copilotからのメモリインポートツールを追加。App Store首位奪取の追い風に。
OpenAI Codex Security — 1.2Mコミットをスキャンし、GnuTLS・PHP・Chromiumなどで14件のCVEを発見
OpenAIが新たなセキュリティスキャンエージェント「Codex Security」を研究プレビューで公開。オープンソースプロジェクトで792件のクリティカル脆弱性を検出済み。
v0 API が custom MCP servers に対応、外部データを組み込んだ生成フローが組みやすく
Vercelは3月6日、v0 API が任意の custom MCP server に接続できるようになったと発表。サーバー設定を API 経由で作り、チャット生成時に server ID を渡せる。
GitHub Copilot in VS Code v1.110: エージェント運用を実務レベルへ引き上げる大型更新
GitHubが3月6日に公開したVS Code v1.110向けCopilot更新を整理。hooks、auto-approve、agent plugins、共有メモリなど、長時間タスクを任せるための基盤が一気に整った。
GitHub Copilot code review がエージェント型アーキテクチャに移行、レビュー精度を改善
GitHubは3月5日、Copilot code review の新アーキテクチャを一般提供開始。ツール呼び出しでリポジトリ全体の文脈を取得し、ノイズの少ないレビューコメントを返す。
Anthropic、エンタープライズ向け「Claude Marketplace」を発表 — サードパーティAIツールを既存契約で購入可能に
Anthropicが企業顧客向けにサードパーティAIソフトウェアを販売するマーケットプレイスを開始。Snowflake、GitLab、Replit、Harvey、Rogo、Lovableが参加。手数料ゼロで既存のAnthropic支出契約から購入可能。
CursorがJetBrains IDEに対応: Agent Client Protocolで接続
CursorがIntelliJ IDEA、PyCharm、WebStormなどJetBrains IDEで利用可能に。Agent Client Protocol経由でエージェント機能を提供。
Cursor Automations発表: Slack・Linear・GitHubトリガーでエージェントが自律稼働
CursorがAutomations機能をリリース。外部イベントをトリガーにコーディングエージェントが自動起動し、レビュー・監視・保守を24時間実行。
GPT-5.4リリース: ネイティブコンピュータ操作と100万トークンコンテキスト搭載
OpenAIがGPT-5.4を発表。汎用モデルとして初めてネイティブコンピュータ操作機能を搭載し、100万トークンのコンテキストウィンドウで長期タスクに対応。
OpenAI Codex for Windowsリリース—AIコーディングエージェントがWindows開発者に到達
OpenAIがCodexデスクトップアプリのWindows版をリリース。複数エージェント管理、ネイティブサンドボックス、長期タスク対応で、Windows開発者のAI活用が加速。
Cursor Automationsリリース—AIコーディングエージェントの自動トリガー機能
CursorがAutomations機能を発表。Slack連携・タイマー・コード追加をトリガーにAIエージェントを自動起動し、開発ワークフローを革新。
OpenAI GPT-5.4リリース—コンピュータ操作対応の新フラッグシップモデル
OpenAIがGPT-5.4を発表。ネイティブなコンピュータ操作機能を搭載し、推論・コーディング・エージェント機能を統合した新しいフラッグシップモデル。
Context7 MCPサーバーに重大脆弱性「ContextCrush」— Cursor・Claude Code・Windsurfユーザーは確認を
AIコーディングアシスタントにドキュメントを提供するContext7 MCPサーバーに脆弱性が発見。Cursor、Claude Code、Windsurfを通じて悪意あるコード実行の可能性。修正済みだが確認推奨。
Cursor「Automations」発表 — イベント駆動型のエージェントコーディングを実現
Cursorが新機能「Automations」を発表。コミット、Slackメッセージ、スケジュールをトリガーにAIエージェントが自動でコードレビュー、バグ検出、インシデント対応を実行。
OpenAI GPT-5.4リリース — 1Mトークン対応・ThinkingとProバージョンも同時発表
OpenAIが本日GPT-5.4を発表。1M token context windowとTool Search機能を搭載し、推論特化のThinkingバージョン、高性能Proバージョンも同時リリース。
OpenAI Symphony — コーディングエージェントに「仕事を任せる」オーケストレーションシステム
OpenAIが公開したSymphonyは、コーディングエージェントの「監督」から「管理」への転換を実現するオープンソースツール。Linearのチケットを登録すればAIが自動でコード作成・テスト・PR・本番反映まで行う。試し方も解説。
Anthropic、国防総省のClaude禁止令に法廷で対抗へ — 倫理スタンスが消費者支持に
トランプ政権がClaude利用を禁止、サプライチェーンリスクに指定。Anthropicは「大量国内監視」「自律兵器」への利用拒否を堅持し、法廷で争う構え。一方で消費者支持が急増。
Claude Code、音声モードをロールアウト開始 — 口頭指示でコーディング可能に
AnthropicがClaude Codeに音声コマンド機能を追加。5%のユーザーから順次展開中。/voiceコマンドで有効化し、ハンズフリーでのコーディングが可能に。
GPT-5.3 Instant: 拒否反応と説教調を大幅削減、ハルシネーションも改善
OpenAIがGPT-5.3 Instantをリリース。過度な拒否や説教調を削減し、ハルシネーション率を最大26.8%改善。開発者とChatGPTユーザーが即日利用可能。
Superset IDE — 10+並列AIエージェント実行を可能にするオープンソースツール
Git worktreesを活用して複数のAIコーディングエージェントを並列実行。Claude Code、Codex CLI等に対応。順次実行のボトルネックを解消し生産性を倍増。
OpenAI GPT-5.3 Instant — ユーザー批判を受けトーン改善、「Cringe」削減へ
OpenAIがChatGPTの新モデルGPT-5.3 Instantをリリース。過剰な注意喚起や上から目線のトーンを改善し、より自然な会話体験を実現。APIでも利用可能に。
AIエージェント「The Council」で会社を運営する防衛テック起業家 — 15人のAIチームで週20時間を節約
フロリダの防衛テック起業家Aaron Sneedは、15人のAIエージェントで構成された「The Council」を使って会社全体を運営している。Chief of Staff AI、法務AI、HR AIなど、各専門領域を担当するエージェントが連携し、週20時間以上の時間を節約。イエスマン問題への対策や、人間の判断が必要な領域まで、ソロファウンダーがAIチームを構築するための実践的知見を詳解。
Nielsen Norman Group最新研究:AI検索と従来検索の使い分け+UXポストモーテム手法
NN/gの最新調査から、ユーザーがAIと従来の検索をどう使い分けるかを解説。さらにUXチーム向けのプロジェクトポストモーテム手法も紹介。ソロ開発者の情報収集と振り返りに活かせる知見。
AIエージェントAPIコスト比較 2026年3月版 — GPT-5 / Claude 4.6 / Gemini 3 の最新料金を徹底比較
2026年3月時点のAIエージェント向けAPI料金を完全比較。OpenAI GPT-5、Anthropic Claude 4.6、Google Gemini 3の最新価格表と、ソロ開発者向けコスト最適化戦略を解説。
Gemini「Past Chats」機能が無料ユーザーにグローバル展開開始
Googleが Gemini の会話記憶機能「Past Chats」を無料ユーザーにも開放。過去の会話を参照してパーソナライズされた回答を返す機能が、有料会員限定から全ユーザーに拡大。
Chrome+Gemini脆弱性でAIブラウザ統合の新たなリスクが露呈(CVE-2026-0628)
Chromeに統合されたGeminiサイドパネルを悪用し、悪意ある拡張機能がカメラ・マイク・ファイルにアクセス可能だった脆弱性が公開。AIエージェントのブラウザ統合が新たな攻撃ベクトルに。
Claude大規模障害が発生、「前例のない需要」で数時間ダウン後に復旧
Anthropicの Claude が3月2日に世界規模の障害を起こし、claude.ai と Claude Code が数時間アクセス不能に。ペンタゴンとの対立報道後の人気急上昇が背景に。
Claude CodeでMP3音声ファイルを読み取る方法【3つのアプローチ】
Claude CodeでMP3などの音声ファイルを文字起こしする方法を解説。Whisper MCP Server、ローカルWhisper CLI、FFmpegを使った3つのアプローチを紹介。
AI画像生成の3レイヤー構造:モデル・API・サービスを体系的に理解する
AI画像生成を構成する3つのレイヤー(モデル層・API/プロバイダー層・サービス層)を体系的に整理。FLUX、Stable Diffusion、DALL-Eなどのモデルから、Pollinations、puter.jsなどの無料サービスまで、ソロ開発者向けに目的別の選び方を解説。
Claude Ads:広告費の無駄を自動検出するClaude Code向けスキルを徹底検証
Google/Meta/YouTube/LinkedIn/TikTok/Microsoft Adsの190項目を自動監査するClaude Code向けスキル「Claude Ads」を一次情報から検証。手動8時間→5分に短縮、B2B SaaS事例ではCPC35%削減。
OpenClaw AIエージェントでポップカルチャーコンテンツを自動生成、$10Kを稼いだ事例
OpenClaw + Claude + CapCutを組み合わせたコンテンツ制作パイプラインで、ショートフォーム動画を完全自動化。Content Rewardsで収益化し、3チャンネルで月$10Kを達成した具体的な手法を解説。
Claude Coworkを100倍強力にする17のベストプラクティス — Nav Toor完全ガイド和訳
Claude Coworkをチャットボットではなく「優秀なジュニア社員」として活用するための完全ガイド。400以上のセッションを経て発見された、コンテキスト設計からタスク設計、自動化、プラグイン活用、安全性まで網羅した17の実践手法を解説。
OpenGoat:AIエージェントの「階層組織」を構築するオープンソースツール登場
OpenClawエージェントを階層的に組織化し、CEO、マネージャー、スペシャリストとして協働させるOpenGoatが登場。Claude Code、Codex、Cursorなど複数ツールを横断してタスクを委譲・実行できる。
Anthropic、金融アドバイザー向けClaude Coworkプラグインを発表:ウェルスマネジメント業界への本格参入
AnthropicがClaude Coworkに金融サービス向けプラグインを追加。ポートフォリオ分析、税務分析、リバランス実行を自動化。LPL Financial(3万人以上のFA)、Orionとの提携も発表。
Trump 大統領、連邦政府の Anthropic 使用を禁止 — OpenAI がペンタゴンと契約締結
Trump 大統領が Anthropic の連邦政府使用を禁止する異例の命令を発出。同日、OpenAI がペンタゴンと AI モデル提供で合意。AI 企業の政府関係に大きな転換点。
Claude Plugins: 75,000以上のスキルを統合するAIエージェントレジストリ
15種類のAIコーディングクライアントに対応。プラグインとスキルの発見・インストールを一元管理するオープンソースツール。
Google LabsがOpalにエージェントステップを追加 — ワークフロー自動化が動的に進化
静的なモデル呼び出しから、目標に応じて最適なツール・モデルを自動選択するエージェント型ワークフローへ。Memory、Dynamic Routing、Interactive Chat機能も追加。
OpenAI Frontier Alliances発表 - Accenture/BCG/Capgemini/McKinseyと提携
OpenAIが4大コンサルティング企業と「Frontier Alliances」を締結。エンタープライズ向けAIエージェント導入を本格化。
Netflix、ByteDanceに72時間以内の対応要求 — Seedance 2.0著作権紛争が訴訟段階へ
NetflixがByteDanceのSeedance 2.0に対し「即時訴訟」を通告。Stranger Things、Squid Game、Bridgertonなどの無断利用を主張。AI動画生成の著作権リスクが顕在化
Gemini 3.1 Pro — ARC-AGI-2で77.1%達成、推論能力が3 Proの2倍以上に
GoogleがGemini 3.1 Proをリリース。ARC-AGI-2ベンチマークで77.1%を達成し、複雑な問題解決能力が大幅に向上。AI Studio、Vertex AI、Gemini CLIで利用可能
Claude Sonnet 4.6リリース — Computer Use大幅強化、1Mトークン対応でエージェント開発が加速
AnthropicがClaude Sonnet 4.6を発表。Computer Use能力の大幅向上、1Mトークンコンテキスト、プロンプトインジェクション耐性強化など、ソロ開発者にとって重要なアップデート
【arXiv速報】KLong:超長期タスクを解決するオープンソースLLMエージェント—Kimi K2を11%超え
研究論文再現タスクでKimi K2 Thinking (1T)を11.28%上回る106Bパラメータモデル。Progressive RLと軌道分割SFTで長期間にわたる複雑なタスクを自律的に完遂。個人開発者のワークフロー自動化に革命的な示唆。
三菱UFJ銀行、LayerX「Ai Workforce」で年間20万時間削減へ
日本のメガバンクがAIエージェント本格導入。提案書自動生成で業務効率化を実現
Variant — スクロールするだけでUIデザインが無限に生成されるAIツール
AIプロンプトを入力してスクロールするだけで、無限にUIバリエーションが生成される新しいデザインツール「Variant」。v0やMagic Patternsとの違いは?
GitHub Copilot が Zed エディタに正式対応 — 高速性とAI支援を両立
GitHub CopilotがZedエディタに正式対応。Pro、Pro+、Business、Enterpriseの全プランで追加ライセンス不要で利用可能に。高速エディタとAIコーディング支援の両立が実現。
Google Gemini 3.1 Pro リリース — 推論能力が倍増、ARC-AGI-2で77.1%達成
GoogleがGemini 3.1 Proをリリース。ARC-AGI-2ベンチマークで77.1%を達成し、前バージョンから推論性能が2倍以上向上。開発者向けにGoogle AI Studio、Vertex AI、GitHub Copilotで提供開始。
Cursor 2.5 プラグインマーケットプレイス公開 — 開発ワークフローをエディタ内で一元化
Cursor 2.5がプラグインマーケットプレイスを導入。Figma、Stripe、AWS、Vercelなど10社との連携で、デザインからデプロイまでエディタ内で完結可能に。
【速報】Figma × Claude Code 連携が発表 — AIで作ったUIを編集可能なFigmaデザインに変換
Figmaが「Claude Code to Figma」機能を発表。Claude Codeで生成したUIをワンコマンドでFigmaの編集可能なレイヤーに変換。デザイナーとエンジニアのワークフローを根本から変える新機能。
Claude Sonnet 4.6リリース — 100万トークン対応・Computer Use大幅強化
AnthropicがClaude Sonnet 4.6をリリース。100万トークンコンテキストウィンドウのベータ対応、Computer Use能力の大幅向上、コーディング性能15%改善を実現。
OpenAI、GPT-4oなど旧モデルを完全廃止 — GPT-5.2時代へ本格移行
OpenAIがChatGPTからGPT-4o、GPT-4.1、GPT-4.1 mini、o4-miniを削除。利用率0.1%への低下を受け、GPT-5.2以降への完全移行を推進。Enterprise契約は2/19まで猶予。
GitHub Copilot SDK/メモリ機能公開 — アシスタントからプラットフォームへ
GitHub Copilot SDKがTechnical Previewで公開、Node.js/Python/Go/.NETに対応。Copilot Memoryもパブリックプレビューで、リポジトリの文脈を28日間保持する学習機能を実装。
GitHub Copilot CLI、10日で7リリースの怒涛アップデート — ターミナルAI本格化
GitHub Copilot CLIがv0.0.404〜v0.0.410まで10日間で7回のリリースを実施。Alt-Screen Buffer Mode、VS Code統合、メモリ最適化など、ターミナル中心の開発者向けに大幅強化。
今週のClaude Codeバズ投稿から見えた「ソロ開発革命」の実態
X(Twitter)でいいね1000以上を獲得したClaude Code関連投稿を分析。年間300万円のSaaS相当を6時間で構築、炎上PJを定時で鎮火——実践者たちの声から見える開発の新常識。
Seedance 2.0がハリウッドと全面対立 — 著作権問題の新局面
ByteDanceのAI動画生成ツール「Seedance 2.0」がハリウッドとの著作権紛争に発展。ディズニーは法的対応開始、業界団体は「著作権侵害を即停止せよ」と声明。
Spotifyエンジニア「12月からコード書いていない」— AI革命の実態
Spotify共同CEOが決算発表で明かした衝撃事実。トップエンジニアはClaude Codeを活用し、12月以降一行もコードを書いていない。一方でバーンアウトへの警告も。
OpenAI GPT-5.3-Codex-Spark: Cerebras連携で1000tok/s達成
OpenAIとCerebrasが共同開発したリアルタイムコーディングモデル。1,000トークン/秒以上の超高速推論で、待ち時間のないコーディング体験を実現。
Claude Opus 4.6リリース: 推論・文脈保持が大幅強化
AnthropicがClaude Opus 4.6をリリース。推論能力と文脈保持が強化され、同社は$14B ARRを達成して史上最速成長のソフトウェア企業に。
Google Gemini 3 Deep Think: ARC-AGI-2で84.6%達成
Googleが科学・研究向け推論モード「Gemini 3 Deep Think」を大幅アップデート。ARC-AGI-2で84.6%、Codeforces Legendary Grandmaster相当を達成。
Anthropic、年間売上$14Bで史上最速成長—Claude Codeが急成長の原動力
Anthropicが年間売上ラン率$14B(約2.1兆円)を達成。Claude Codeは$2.5B超で6週間で倍増。ソフトウェア企業として史上最速の成長を記録。
ByteDance Seedance 2.0、ディズニーから著作権侵害で停止警告
ByteDanceの新AIビデオ生成モデル「Seedance 2.0」に対し、ディズニーが停止警告を送付。マーベル、スターウォーズなどのキャラクターを無断使用していると批判。
GitHub Copilot JetBrains、Agent Skills対応でワークフローカスタマイズが可能に
JetBrains IDEのGitHub CopilotがAgent Skillsに対応。プロジェクト固有のスキルを作成・共有でき、開発ワークフローに合わせたAI支援が実現する。
Google Chrome、WebMCPの早期プレビューを開始—AIエージェントがWebサイトを直接操作可能に
GoogleとMicrosoftが共同開発したWebMCP(Web Model Context Protocol)がChrome 146 Canaryで利用可能に。Webサイトが構造化ツールをAIエージェントに公開でき、従来比67%の計算オーバーヘッド削減を実現。
OpenAI GPT-5.3 Codex Spark発表 - リアルタイムコーディング支援の新時代
OpenAIが開発者向けGPT-5.3 Codex Sparkを発表。従来の補完から対話的開発支援へ進化し、高速推論とコンテキスト理解で開発効率を大幅向上
Anthropic、30億ドル資金調達で企業価値380億ドルに - Claude開発加速
Claude開発のAnthropic PBCが30億ドルの資金調達を完了。企業価値は前回9月の183億ドルから380億ドルへ倍増。シンガポールGICとCoatue Management主導
GitHub Copilot .NET テスト機能が Visual Studio 2026で一般提供開始
Microsoft Visual Studio 2026 v18.3でGitHub Copilot Testing for .NETが一般提供開始。AIによるユニットテスト生成・実行・修正の完全自動化で開発者の生産性が大幅向上
Claude無料プランに大幅機能追加 - コネクタ・スキル・ファイル機能が利用可能に
AnthropicがClaude無料プランにコネクタ、スキル、ファイル処理機能を追加。従来有料限定だった外部サービス連携と文書作業が無料で利用可能に
Claude無料プランに Connectors・Skills・ファイル機能を追加 - OpenAI広告戦略への対抗策
AnthropicがClaude無料プランに有料限定だったConnectors、Skills、ファイル作成機能を開放。OpenAIのChatGPT広告導入と対照的な戦略で、無料でエンタープライズ級AIワークフローの構築が可能に。
GitHub Copilot Testing for .NET が Visual Studio 2026 で一般提供開始 - AI駆動テスト生成の新標準
Visual Studio 2026 v18.3でGitHub Copilot Testing for .NETが一般提供開始。AI駆動でユニットテストを自動生成・実行・修正するエンドツーエンドワークフローにより、.NET開発の品質保証プロセスを革新。
OpenAI GPT-5.3 Codex Spark リリース - リアルタイムコーディング支援で開発体験を革新
OpenAIが新コーディングモデルGPT-5.3 Codex Sparkを発表。リアルタイム推論、改良されたコンテキスト理解、ハルシネーション削減により、AIコーディング支援が静的補完から対話的協働パートナーへ進化。
GitHub Mobile Model Picker登場:外出先でClaude・GPT-5をタスク別に選択可能
GitHub MobileでCopilot Pro/Pro+ユーザーがモデル選択可能に。Claude Opus 4.5/4.6、GPT-5.1/5.2から用途別選択、Auto設定で速度・性能の自動最適化も対応。
GitHub Copilot Testing for .NET がVisual Studio 2026 v18.3に一般提供開始 - AI駆動テスト自動生成の新時代
AI駆動のユニットテスト生成機能がVisual Studio 2026で一般利用可能に。コードからテスト実行まで統合されたワークフローで、.NETソロ開発者のテスト作成時間を大幅短縮。
Claude無料プランに Connectors・Skills・ファイル機能を追加 - Anthropicの戦略的差別化でAIアシスタント競争激化
Anthropicが有料限定だったConnectors、Skills、ファイル作成機能を無料ユーザーに開放。OpenAIの広告導入と対照的な戦略で、ソロ開発者のAI活用コストを大幅削減。
GitHub元CEO、AI開発ツールで60M$調達
前GitHub CEOのThomas DohmkeがEntireで記録的な60Mドルシード調達を完了。AI生成コード向けインフラで評価額300Mドル
Claude無料プランにConnectors・Skills・Files機能が開放 — OpenAI広告導入への対抗
Anthropicが2月11日、有料プラン限定だったConnectors、Skills、Files機能を無料ユーザーに開放。ChatGPT広告導入の2日後という絶妙なタイミング。
Microsoft 2月Patch Tuesday — 58脆弱性修正、6件のゼロデイ含む
Microsoftが2月の定例セキュリティ更新をリリース。58件の脆弱性を修正し、うち6件は既に悪用が確認されたゼロデイ。開発環境にも影響。
Nebius が Tavily を $275M で買収 — AIエージェント向け検索インフラの争奪戦
クラウドプロバイダーNebiusがAIエージェント向け検索サービスTavilyを2.75億ドルで買収。エージェントが最新情報を取得するインフラ層の重要性が高まる。
Prima脳MRI AI実装手法 — 97.5%精度で数秒診断、医療AI実用化の成功モデル
ミシガン大学開発のPrima AIが脳MRI診断を数秒で97.5%精度実現。30万件超のデータで訓練、50種類の神経疾患を識別し緊急度判定も可能。「医療画像のChatGPT」として他分野への展開も期待。AI Solo Builderが学ぶべき実装成功要因。
LeCun AMI Labs詳細分析 — 50億ドルでLLM支配に挑戦する世界モデル革命
チューリング賞受賞者LeCunがMeta退社後、50億ドル評価でAMI Labs設立。「LLMは5年で廃れる」として世界モデルに賭ける。医療AIで実証し、パリをLLM後時代の中心に。AI Solo Builderが押さえるべき技術パラダイムシフト。
Claude無料機能拡充で個人開発者革命 — ChatGPT広告化に対抗
Anthropic Claude が無料ユーザーに元有料機能を全面開放。Files作成・編集、Connectors、Skillsが利用可能に。ChatGPT広告導入への戦略的対抗策。
Claude Opus 4.6が500+脆弱性を発見 — AI防御革命の幕開け
Anthropic Claude Opus 4.6が専用ツールなしで500以上の未知高深刻度脆弱性を発見。人間の研究者レベルの推論力で、個人開発者の防御力を大企業レベルまで引き上げ。
OpenAI Frontier完全解説 — エンタープライズAI革命の決定版プラットフォーム
OpenAI Frontierがエンタープライズ市場に本格参戦。AIエージェントを「デジタル従業員」として既存システムと統合し、人間と同様の管理手法を適用。HP、Oracle、State Farm、Uberが導入済み。AI Solo Builderが押さえるべき企業AI導入の新標準。
Claude Code、プロジェクトメモリ機能を追加 — 仕様をMarkdownで固定してブレを減らす
Claude Code運用で最大の敵は“コンテキストのブレ”。プロジェクトメモリで、仕様・設計・禁止事項をリポジトリ内Markdownに固定し、毎回同じ前提で走らせる運用が現実的になった。
OpenAI Codex、Review Modeを追加 — PR差分レビューと修正案の往復を短縮
AIにコードを書かせる時代のボトルネックは“レビュー”。CodexのReview Modeで、差分の意図説明と修正案の提示をセットにし、PR往復回数を減らす運用がしやすくなる。
Voxtral Mini 4B、ブラウザでリアルタイム音声認識 — ローカルASRが実用圏へ
音声をクラウドに送らず、ブラウザでリアルタイム認識。音声I/Oの組み込みコストが下がり、個人開発でも扱いやすくなる。
Cursor、Shared Rulesを公開 — リポジトリに“AIのルール”を同梱
Cursor運用での再現性を上げる鍵は、ツールではなくルール。Shared Rulesで、設計方針・禁止事項・PR粒度などをリポジトリに同梱し、提案のブレを抑える流れが加速。
Figr.design:$225万シード調達のAIデザインエージェントがプロダクト設計を革新する
Antler Residency発、3ヶ月で500+チーム導入。プロダクト文脈を理解し、UX決定を30%高速化するAIデザインエージェント「Figr」の詳細分析