音声テキスト変換(音声入力・文字起こし)無料ツール
マイクに話しかけるだけでリアルタイム文字起こし。Web Speech APIをブラウザ完結で利用。音声データはサーバー送信ゼロ。議事録・会議メモ・ライティングに。日本語・英語・中国語など8言語対応。登録不要・完全無料。
最終更新:2026年5月30日
Google Chrome・Microsoft Edge・Safari への切り替えをお試しください。Firefoxは非対応です。
使い方ガイド:こんな場面で役立ちます
ドロップダウンから言語を選択し「録音開始」ボタンをクリックします。ブラウザからマイクへのアクセス許可が求められたら「許可」をクリックしてください。録音インジケーターが赤く点灯したら準備完了です。
ゆっくり・明瞭に話すと認識精度が上がります。話すそばから仮テキスト(薄いグレー)がリアルタイム表示され、認識が確定すると確定テキスト(黒)に変わります。
「録音停止」ボタンで録音を終了。「テキストをコピー」でクリップボードに、「TXTダウンロード」でテキストファイルとして保存できます。テキストエリアを直接編集して誤認識を修正することも可能です。
主な利用シーン
議事録・会議メモ
会議中にブラウザを開いてマイクに向けるだけで会話を自動文字起こし。連続認識モードで長時間の会議にも対応。後でコピーしてドキュメントに貼り付けられます。
ライティング・ブログ執筆
アイデアが浮かんだときにキーボードを使わず口述筆記。思考の流れをそのまま文字化できるため、下書き作成のスピードが大幅に上がります。
インタビュー・取材メモ
対面インタビューや電話取材の内容をリアルタイムで文字化。後から文字起こしを行う時間を削減できます。
語学練習・発音チェック
英語や中国語で話しかけて認識されたテキストを確認することで、発音の正確さをセルフチェックできます。認識されなかった単語は発音改善の手がかりになります。
アクセシビリティ・身体的サポート
手や腕の疲労・けが等でキーボード入力が困難な場合の代替入力手段として活用できます。音声のみでテキストを作成・コピー・保存まで完結します。
ブラウザ対応状況と非対応時の対処法
| ブラウザ | 対応状況 | 備考 |
|---|---|---|
| Google Chrome(デスクトップ) | ✅ 完全対応 | Google音声認識エンジン利用。精度高 |
| Microsoft Edge(デスクトップ) | ✅ 完全対応 | Chromiumベースのため同等の精度 |
| Chrome(Android) | ✅ 対応 | モバイルでも動作確認済み |
| Safari(macOS) | ✅ 対応(要確認) | iOS/macOS標準音声エンジンを利用 |
| Safari(iOS) | ⚠️ 部分対応 | 連続認識の挙動がブラウザ依存 |
| Mozilla Firefox | ❌ 非対応 | Web Speech API未実装。代替案を参照 |
| Opera / Brave | ⚠️ 部分対応 | Chromiumベースだが設定依存 |
Firefox等の非対応ブラウザへの対処法
Chromeをインストールして使う
最も簡単な解決策はGoogle Chromeをインストールすることです。Chromeは全主要プラットフォーム(Windows・Mac・Linux・Android)で完全対応しており、認識精度も最高水準です。
Windowsのネイティブ音声認識
Windows 10/11には標準で音声認識機能があります。「Win + H」キーで起動し、音声入力を任意のテキストフィールドで使えます。ブラウザに依存しないため、Firefoxでも利用可能です。
macOSの音声入力
macOSでは「システム設定→キーボード→音声入力」を有効にすると、Fnキー2回押しで音声入力が起動します。こちらもブラウザに依存せず利用可能です。
プライバシー・セキュリティの詳細
音声データの流れ
このツールはブラウザ組み込みのWeb Speech API(SpeechRecognition)を使用しています。音声データの処理経路はブラウザによって異なります:
| ブラウザ | 音声処理場所 | プライバシーリスク |
|---|---|---|
| Chrome / Edge | Googleのクラウドサーバー | 中(Googleのプライバシーポリシーに従う) |
| Safari(macOS/iOS) | デバイス上 or Appleサーバー | 低(オンデバイス処理が多い) |
機密性の高い音声への推奨
- 社外秘・個人情報を含む会議の文字起こしにはSafari(macOS/iOS)の使用を推奨します
- Chromeでも音声データはGoogleの利用規約に基づき処理されるため、企業情報の取り扱いには社内セキュリティポリシーを確認してください
- 最高レベルの機密性が必要な場合は、Whisper等のオフライン音声認識ソフトウェアの使用を検討してください
他の音声テキスト変換サービスとの比較
主要な音声テキスト変換サービスと当ツールを比較しました(2026年5月調査)。
| 項目 | tools-navi.jp (当サイト) |
Google Docs 音声入力 |
Notta・Otter.ai | Whisper (ローカル) |
|---|---|---|---|---|
| 登録不要 | ✅ 不要 | ❌ Googleアカウント必要 | ❌ アカウント必要 | ✅ 不要 |
| 無料 | ✅ 完全無料 | ✅ 無料 | ⚠️ 制限付き無料 | ✅ 無料(設定が必要) |
| リアルタイム文字起こし | ✅ 対応 | ✅ 対応 | ✅ 対応 | ❌ 非対応(バッチ) |
| サーバー送信なし | ✅(ツールナビへ) | ❌ Google送信 | ❌ クラウド送信 | ✅ ローカル完結 |
| ブラウザだけで使える | ✅ | ✅ | ✅ | ❌ Python環境が必要 |
| 日本語対応 | ✅ | ✅ | ✅ | ✅ |
| TXTダウンロード | ✅ | ⚠️ Docs経由 | ✅ | ✅ |
| 連続認識モード | ✅ | ✅ | ✅ | ❌ |
よくある質問(FAQ)
- 音声データはサーバーに送信されますか?
- ツールナビのサーバーへの送信はゼロです。Chrome・EdgeではGoogleの音声認識エンジンがバックエンドで処理を行う場合がありますが、ツールナビは一切関与しません。Safariはデバイス上で処理されることが多く、よりプライベートな環境です。いずれのブラウザでも、ツールナビが音声や認識テキストを収集・記録することはありません。
- Firefoxで使えますか?
- FirefoxはWeb Speech API(SpeechRecognition)を実装していないため、このツールは動作しません。ツール画面上部に非対応ブラウザ向けのガイダンスが表示されます。代替としてChromeまたはEdgeへの切り替え、もしくはWindowsの「Win+H」音声入力機能(ブラウザ非依存)の使用を推奨します。
- マイクの許可を求めるダイアログが出ません
- ブラウザの設定でマイクのアクセスがブロックされている可能性があります。Chromeの場合はアドレスバー左の錠前アイコン→「サイトの設定」→「マイク」を「許可」に変更してください。変更後はページをリロードして再度「録音開始」を押してください。
- 認識精度を上げるにはどうすればいいですか?
- 以下の方法が有効です。①静かな環境で使う②マイクに30cm以内に近づく③ゆっくりはっきり話す④言語設定を話している言語と合わせる⑤ヘッドセットや指向性マイクを使う⑥長文は適度に区切って話す。専門用語・固有名詞は発音後にテキストエリアを直接編集して修正することを推奨します。
- 連続認識モードはどのように使いますか?
- 「連続認識」スイッチがONの状態(デフォルト)で録音開始すると、発話の間(無音区間)があっても自動的に録音が継続されます。長い議事録や口述筆記に最適です。OFFにすると1回の発話ごとに停止するシングル認識モードになります。
- 句読点モードとは何ですか?
- 句読点モードをONにすると認識した文末に「。」を自動付加します(すでに「。」「.」「?」「!」などで終わっている場合を除く)。議事録や文書を作成する際に句点を手入力する手間が省けます。カジュアルなメモ書きにはOFFの方が自然な場合があります。
- スマートフォン(iPhone/Android)でも使えますか?
- Android版ChromeとiOS版Safariで動作します。ただしモバイル環境ではブラウザの制限により連続認識が途中で停止する場合があります。その場合は「録音開始」を再度タップすると再開できます。
技術仕様・実装の詳細
使用技術
| 項目 | 実装方式 |
|---|---|
| 音声認識 | Web Speech API(SpeechRecognition / webkitSpeechRecognition) |
| リアルタイム表示 | interimResults = true でイベントごとに仮テキストを更新 |
| 連続認識 | continuous = true + onend自動再起動(録音中断時) |
| 言語対応 | SpeechRecognition.lang プロパティで8言語切り替え |
| テキストコピー | Clipboard API(非対応ブラウザはexecCommand fallback) |
| ダウンロード | Blob + URL.createObjectURL でTXT生成・a要素クリック |
| 非対応検出 | window.SpeechRecognition || window.webkitSpeechRecognition の有無で判定 |