🎵 Whisper 音频转文字测试

📁 拖拽音频文件到此处或点击选择文件

☁️ 使用R2存储链接

输入Cloudflare R2存储的音频文件链接进行处理

🔧 API接口测试

测试不同的API端点和参数

📜 API 使用文档

所有文件上传接口现在返回统一的、包含详细性能分析的JSON结果。

✅ API端点

本服务提供一个统一的API端点,接受 multipart/form-data 格式的文件上传,并返回详细的转录结果:

  • POST /api/v1/audio/transcriptions

📋 cURL 调用示例

重要:请务必为 file 参数指定正确的MIME类型,例如 type=audio/mpeg,以通过API端点的安全验证。

支持的常见音频文件类型及其MIME类型:

  • .mp3audio/mpeg
  • .wavaudio/wav
  • .m4aaudio/mp4
  • .oggaudio/ogg
  • .flacaudio/flac
curl -X POST "https://your-worker.workers.dev/api/v1/audio/transcriptions"   -F "file=@/path/to/your/audio.mp3;type=audio/mpeg"

📊 统一的JSON返回结果结构

所有接口现在都返回包含 performance_metrics 对象的详细结果,结构如下:

{
  "text": "...",
  "segments": [...],
  "vtt": "...",
  "word_count": 16,
  "performance_metrics": {
    "request_start_time": "...",
    "request_end_time": "...",
    "total_duration_ms": 2028,
    "preprocessing_duration_ms": 0,
    "ai_processing_duration_ms": 2019,
    "file_info": {
      "name": "MP3_82.mp3",
      "size_bytes": 793001,
      "size_mb": "0.76",
      "type": "application/octet-stream"
    },
    "audio_duration_estimate": "35.54s",
    "processing_speed_ratio": "0.06x"
  }
}
等待选择处理方式...