Claude CodeでMP3音声ファイルを読み取る方法【3つのアプローチ】

概要

Claude Codeは現時点で音声ファイルを直接解析する機能を持っていない。しかし、外部ツールとの連携により、MP3などの音声コンテンツを文字起こしして処理することが可能だ。

本記事では、Claude CodeでMP3ファイルを扱うための3つの実用的なアプローチを紹介する。

最も簡単な方法は、MCP（Model Context Protocol）経由でWhisperを使うこと。

.claude/mcp.json に以下を追加:

{
  "mcpServers": {
    "whisper-mcp": {
      "command": "npx",
      "args": ["-y", "whisper-mcp"]
    }
  }
}

セットアップ後、Claude Codeに「この音声ファイルを文字起こしして」と依頼するだけで動作する。

OpenAI Whisperをローカルにインストールして使う方法。

pip install openai-whisper

whisper audio.mp3 --model base --language ja

音声の前処理にFFmpegを使い、外部APIで文字起こしする方法。

ffprobe -v quiet -print_format json -show_format audio.mp3

ffmpeg -i audio.mp3 -ar 16000 -ac 1 output.wav

会議の録音ファイルをWhisperで文字起こしし、Claude Codeで要約・整形。

音声コンテンツを文字に変換し、キーポイント抽出やショーノート作成。

録音インタビューから引用可能なテキストを生成。

方法	難易度	API必要	推奨用途
Whisper MCP	簡単	不要	日常的な文字起こし
ローカルWhisper	中程度	不要	大量処理、オフライン
FFmpeg + API	中程度	必要	高精度が必要な場合

MCP経由が最もシームレスに統合できるため、まずはWhisper MCPの導入をおすすめする。