AI議事録の固有名詞誤変換を辞書機能で解決する方法
AIが「田中部長」を「棚課部長」に変換する理由と、辞書機能で社名・人名・専門用語の誤変換を根本から解決する具体的な手順を解説。業界別の辞書登録例とNotta・Otter.ai比較付き。
「田中部長の発言をそのまま議事録に貼り付けたら、"棚課部長"になっていた」
初めてAI文字起こしを使った人の多くが経験する、この種のミスは笑い話で済まないケースがある。クライアント向けの議事録、役員会の記録、契約交渉のメモ——場面によっては、誤った表記のまま配布されることが実質的なリスクになる。
AI音声認識の全体的な精度は年々上がっている。しかし固有名詞に限れば、2026年現在も「よく間違える」という性質は基本的に変わっていない。本稿では、なぜAIは固有名詞を間違えるのか、その構造的な原因を説明した上で、MinuteKeepの辞書機能を使って誤変換を根本から解消する具体的な方法を解説する。
議事録作成を自動化しませんか? MinuteKeepは、会議を録音するだけでAIが文字起こし・要約・タスク抽出まで自動化。9言語対応、月額0円、30分無料。
なぜAIは固有名詞を間違えるのか
音声認識モデルの「統計的な推測」という性質
WhisperをはじめとするAI音声認識モデルは、数十万時間以上の音声データで訓練されている。モデルが音声を聞くとき、やっていることは「この音に最も確率が高い文字列は何か」を推測することだ。
一般的な単語——「会議」「報告書」「プロジェクト」——は訓練データに大量に含まれているため、正確に認識される。しかし、特定の企業が使う社名、プロジェクト名、特定業界の専門用語は、訓練データに含まれる頻度が極端に少ない。結果として、モデルは「音が近い、よく知っている単語」に置き換えてしまう。
これはモデルの欠陥ではなく、設計の必然だ。汎用的な音声認識として優秀であるがゆえに、特定組織の固有語彙を正確に把握する仕組みを持っていない。
日本語特有の誤変換パターン
日本語の固有名詞誤変換には、いくつかの典型的なパターンがある。
カタカナ語の音近似
英語由来のカタカナ語は、発音が似た別の語に変換されやすい。「SaaS(サース)」が「サースト」や「ソース」になる、「ローンチ」が「論知」になる、「バーティカル」が意味の異なる語に置き換えられるといったケースが報告されている。
同音異義語による誤選択
日本語は同音異義語が多い言語だ。「田中部長」の「たなか」と「棚課(たなか)」のように、音声的には同一でも意味が異なる語に置換されることがある。人名は特にこのパターンに陥りやすい。
複合語・固有名詞の分解
「MinuteKeep(ミニットキープ)」「トヨタ自動車」など、複合語として認識されるべき名詞が「ミニット キープ」「トヨタ 自動車」のように分解されるか、あるいはまったく異なる語に変換される。
略称・アクロニムの誤認識
「DX(ディーエックス)」「AI(エーアイ)」「SDK」「API」といった略称は、音声での発音パターンが文字列と一致しないため、特に誤認識が起きやすい。
研究が示す固有名詞認識の限界
技術的な検証でも、固有名詞はAI音声認識の弱点として一貫して挙げられている。Whisperのモデル比較研究では、固有名詞カテゴリにおける誤り率が一般語に比べて有意に高いことが確認されており、OpenAI自身もプロンプトエンジニアリングによる部分的な改善策を示しつつも、根本的な制約として認識している。
日本語においては、同音異義語の多さとカタカナ語の音韻的な曖昧さが重なるため、固有名詞の誤変換は英語環境より複雑になりやすい。詳しい精度検証についてはAI文字起こしの精度検証:WER・CERとは何かを参照されたい。
辞書機能はどう機能するか
後処理による確定的な置換
MinuteKeepの辞書機能は、AIによる文字起こし完了後、テキストがユーザーに表示される前に適用される「後処理置換」だ。
仕組みはシンプルだ。ユーザーが「誤変換語 → 正しい語」のペアを登録しておくと、Whisperが出力したテキストに対して、登録した誤変換語が検索・置換される。確率論的な推測ではなく、文字列の完全一致に基づく決定論的な処理なので、登録した語は必ず正しく表示される。
AIベースのアプローチとの違い
「固有名詞をAIに覚えさせる」アプローチ(プロンプトベース、ファインチューニング)と後処理置換では、使い勝手が大きく異なる。
| 比較軸 | プロンプトベース | 後処理辞書(MinuteKeep) |
|---|---|---|
| 設定の手間 | 毎回の録音前に設定が必要 | 一度設定すれば継続適用 |
| 確実性 | 確率的(改善されるが保証なし) | 決定論的(必ず置換される) |
| 累積効果 | なし | あり(エントリを積み重ねるほど精度向上) |
| 既存テキストへの適用 | 不可 | 新規録音から即時適用 |
| 技術的知識の要否 | APIアクセスが必要な場合あり | アプリ内で完結 |
ローカル保存の意味
辞書データはデバイス内にローカル保存される。クラウドに送信されない。社名や顧客名など、外部に出したくない情報を辞書に含める場合でも、データの外部流出リスクが発生しない。
MinuteKeep辞書機能の設定手順
ステップ1:辞書画面を開く
アプリ下部のタブバーから「設定」をタップし、設定画面内の「辞書」項目を選択する。辞書画面には既存のエントリ一覧と、新規追加ボタンが表示される。初回は一覧が空の状態だ。
ステップ2:ペアを追加する
「+」ボタンをタップすると、2つの入力欄が現れる。
- 誤変換語(上段): Whisperが実際に出力した間違った語を入力する
- 正しい語(下段): 正しく表示させたい語を入力する
「棚課部長」→「田中部長」なら、上段に「棚課部長」、下段に「田中部長」と入力して保存する。
実践的なポイント: 正確な誤変換語を確認するには、テスト録音をして実際の出力を確認するのが確実だ。「おそらくこう変換されるだろう」という推測ではなく、実際の出力テキストをコピーして登録すると、置換が確実に機能する。
ステップ3:次の録音で確認する
設定後の次の録音から辞書が適用される。登録した語が含まれる音声を録音し、文字起こし結果に正しい語が表示されているか確認する。
ステップ4:辞書を積み上げる
最初の数回の録音後、議事録をスキャンして残っている誤変換を拾い上げ、順次追加していく。2〜3回の会議で主要な固有名詞をカバーできれば、それ以降の手動修正作業は大幅に減る。
辞書はMinuteKeepが対応する9言語すべてに対して機能する。日本語と英語が混在する会議でも、登録したエントリは両方の文脈で適用される。多言語会議における文字起こしの課題については多言語会議のAI文字起こし:英語×日本語の実態で詳しく扱っている。
業界別:辞書登録の典型例
Whisperが誤変換しやすいパターンは業界によって異なる。以下は各業界でよく発生する誤変換パターンと推奨登録例だ。
IT・SaaS企業
| Whisperの出力(誤) | 正しい表記 |
|---|---|
| ギットハブ / ギットはぶ | GitHub |
| ドッカー | Docker |
| クーバネティス / クーバーネティス | Kubernetes |
| ソース | SaaS |
| エーピーアイ | API |
| タイプスクリプト | TypeScript |
| デブオプス | DevOps |
| スラック | Slack(社名として) |
| ジラ / ジーラ | Jira |
| コンフルエンス | Confluence |
社名・プロダクト名は「みにゅーときーぷ」→「MinuteKeep」のように、読み仮名ベースの誤変換と英字表記の誤変換の両方を登録しておくと安全だ。
製造・メーカー
| Whisperの出力(誤) | 正しい表記 |
|---|---|
| カイゼン活動(かいざん活動) | 改善活動 |
| 受け入れ / うけ入れ | 受入(社内表記に依存) |
| 鋳型(いがた) | 鋳型(社内読みに依存) |
| シックスシグマ | シックスシグマ(そのままで不要な場合あり) |
| OEMパートナー | OEMパートナー |
| 仕様変更れんらく書 | 仕様変更連絡書 |
製造業では、JIS規格名、部品番号、工程名などが独自の読みや表記を持つ場合が多い。「QC(キューシー)」「4M」「FMEA(エフエムイーエー)」なども登録候補に挙がりやすい。
医療・ヘルスケア
| Whisperの出力(誤) | 正しい表記 |
|---|---|
| 心房細動 / 心房細働 | 心房細動(AF) |
| 電子カルテ → DKR | 電子カルテ(HER) |
| ティーピーエー | tPA |
| インフォームド・コンセント | インフォームドコンセント |
| クリニカルパス | クリニカルパス |
| 診察未来(しんさつみらい) | 診察未来(製品名の場合) |
重要な留意点: 辞書機能による置換は、医療記録として確定的に使用する前に、必ず専門家による目視確認のプロセスを組み合わせること。辞書は補助ツールとして活用する位置づけが適切だ。
法務・士業
| Whisperの出力(誤) | 正しい表記 |
|---|---|
| 免責事項 / 免債事項 | 免責事項 |
| 損害賠償 / 損害倍増 | 損害賠償 |
| エヌディーエー | NDA |
| アイピーオー | IPO |
| デューデリ | デューデリジェンス(またはDD) |
| 著作権侵害 / 著作権侵怪 | 著作権侵害 |
法律文書の性質上、同音異義語の誤変換は特にリスクが高い。「制裁(せいさい)」と「清算(せいさん)」、「契約(けいやく)」と「経約(存在しない語)」のような近似語への誤変換は、文脈を読まないと判別できない。ホモフォン(同音異義語)が問題になりうる箇所については、辞書機能の適用後も目視確認を組み合わせることを推奨する。
競合アプリとの辞書機能比較
AI文字起こしアプリの辞書・カスタム語彙機能は、各サービスで実装の思想が異なる。
Notta
Nottaは有料プランで「カスタム辞書登録」機能を提供している。無料プランでは3語まで、有料プランでは200語まで登録可能だ。Nottaの辞書は「読み」と「表記」のペアで登録する形式で、音声認識の前段階で活用されるアプローチと組み合わせて精度を高める設計になっている。
制限点として、無料プランでは実質的に機能しない(3語の上限)こと、語彙登録数がプランで上限が決まること、サブスクリプションを解約すると登録した辞書へのアクセスが失われる可能性があることが挙げられる。
Otter.ai
Otter.aiはカスタムボキャブラリー機能を有料プランで提供している。Pro(月額$8.33〜)では人名100語・その他語彙100語を登録でき、Businessプランでは組織全体で800語まで共有できる。ただし、Otter.aiの日本語サポートは2025年末以降に強化されているものの、日本語固有名詞の辞書精度については英語と比較して限定的な面がある。
Fireflies.ai
Fireflies.aiはカスタムボキャブラリー機能を持ち、登録した語彙を「学習」させる形で精度を向上させる仕組みだ。ただし、Fireflies.aiは日本語対応が限定的で、日本語固有名詞の問題に対する直接的な解決策としては使いにくい面がある。
MinuteKeepとの比較整理
| 比較軸 | Notta | Otter.ai | MinuteKeep |
|---|---|---|---|
| 辞書機能の有無 | あり(有料) | あり(有料) | あり(全プラン) |
| 語彙上限 | 200語(有料) / 3語(無料) | 100語+100語(Pro) | 制限なし |
| 処理タイミング | 前処理(確率的) | 前処理(確率的) | 後処理(決定論的) |
| データ保存先 | クラウド | クラウド | ローカル(デバイス) |
| サブスク終了後 | 辞書アクセス不明 | 辞書アクセス不明 | デバイスに残る |
| 日本語固有名詞対応 | 強め | 限定的 | 全言語対応 |
MinuteKeepの辞書が「後処理・決定論的」である点は、「確実に直す」という要件に対して優位に働く。Nottaのような前処理アプローチは認識精度の全体的な向上に効果があるが、特定語の完全な修正を保証するものではない。MinuteKeepのアプローチは、登録した語が必ず正しく置換されることを担保している。
AI議事録アプリの全体的な機能・料金比較についてはAI議事録アプリ比較2026:サブスクなしで使えるのはどれ?を参照されたい。
MinuteKeepを試してみる
固有名詞の誤変換が気になっている方は、MinuteKeepを無料で試すことができる。インストール時点で30分分の文字起こし枠が付与される。アカウント登録不要で、App Storeから即日使用可能だ。
辞書機能は最初の録音から使用できる。まずは自社名と主要メンバーの名前を数件登録して、次の会議で確認してみることを勧める。
料金体系(サブスクリプションなし)
- 30分:無料(インストール時付与)
- 2時間:¥150
- 7時間:¥480
- 18時間:¥1,000
使った分だけ課金される従量制なので、月に数回しか会議がない場合でも固定費が発生しない。
辞書管理のベストプラクティス
辞書は登録して終わりではなく、メンテナンスが品質を維持する。
実際の誤変換から逆算して登録する
「おそらくこう変換されるだろう」という推測で登録するより、実際の文字起こし出力をそのまま登録する方が正確に機能する。新しいプロダクト名や人名が出てくる会議の前に短いテスト録音を行い、出力を確認してから辞書に追加する手順が効率的だ。
大文字小文字・表記ゆれを複数登録する
同じ語でもWhisperの出力にゆれが生じることがある。「Kubernetes」が「kubernetes」「クーバネティス」「クーバーネティス」の3パターンで出る場合、それぞれを別エントリとして登録する必要がある。
読み上げ形式と略称形式の両方を登録する
「SDK(エスディーケー)」は、話者によって「エスディーケー」と発音するケースと、「エスディーKay」「Software Development Kit(ソフトウェア デベロップメント キット)」と展開して読むケースがある。よく使われる発音パターンを複数押さえておくと漏れが少ない。
重要な会議の前日に追加する
新規クライアントの初回ミーティング、プロダクトローンチのキックオフ、M&Aの交渉——これらでは、事前に確認できる社名・人名・製品名を登録しておくと、議事録の事後修正作業がほぼゼロになる。登録作業自体は1件あたり30秒程度だ。
定期的に棚卸しする
製品名が変わった、担当者が交代した、プロジェクトが完了した——そういった変化に合わせて辞書を更新しないと、古いエントリが誤変換を引き起こすことがある。四半期に1回程度、登録内容を見直す習慣をつけると辞書の精度が長期的に保たれる。
複数語フレーズも登録できる
「株式会社〇〇ソリューションズ」のような2語以上の固有名詞も、フレーズとしてそのまま登録できる。社名の正式表記が長い場合でも対応可能だ。
よくある質問
Q. 辞書機能は無料の30分枠から使えますか?
はい。辞書機能はプランに関係なく、インストール直後から利用できる。30分の無料枠での録音から辞書が適用される。
Q. 同じ誤変換語が複数の正しい語に対応している場合はどうすればいいですか?
例えば「たなか」が「田中(人名)」になる場合と「棚科(部署名)」になる場合が混在するケースは、後処理辞書の構造上、1対1の対応しか設定できない。こうした同音異義語の問題は辞書では解消できないため、文脈に応じた目視確認が必要になる。
Q. 既存の議事録にも辞書が適用されますか?
いいえ。辞書は新規録音・文字起こしから適用される。辞書登録前に作成した議事録には適用されないため、既存のテキストはResult画面で直接編集する必要がある。
Q. 登録語数に上限はありますか?
公式な上限は設けられていない。実用的には、特定チームや職種でよく出る固有名詞を20〜80件程度カバーすれば、主要な誤変換は解消できるケースがほとんどだ。
Q. 英語の固有名詞も登録できますか?
できる。日本語の音声内に英語の社名や製品名が登場する場合(「今期はSalesforceとの連携を〜」など)の誤変換も辞書で対応可能だ。MinuteKeepは9言語の文字起こしに対応しており、辞書はすべての言語に横断して機能する。
まとめ
AI音声認識が固有名詞を間違える根本的な理由は、モデルが「確率的に最も可能性が高い語を選ぶ」という設計にある。特定組織の固有語彙は訓練データに含まれないため、音が近い一般語に置き換えられる。これはモデルの精度を上げても完全には解消しない問題だ。
MinuteKeepの辞書機能は、この問題に対して「AIの判断を後処理で確定的に上書きする」というアプローチで対応している。Whisperの出力テキストに対して、登録した置換ペアを確実に適用するため、辞書に登録した語は必ず正しく表示される。
設定は4ステップで完結し、一度登録すれば以降の全録音に自動適用される。登録するたびに精度が累積的に上がる。社名、人名、専門用語、略称——組織固有の語彙を辞書に積み上げていくことで、AI議事録の後処理コストを実質的にゼロに近づけられる。