MinuteKeepの辞書機能で固有名詞の誤変換をゼロにする方法
Whisperが変換した『誤り→正解』パターンを実例で解説。社内の人名・社名・専門用語の誤変換を辞書登録で確実に修正。業界別登録例とメンテナンスのコツを紹介。
AI文字起こしの避けられない課題:固有名詞誤変換
「今月の新入社員は田中太郎です」という音声が「棚課太郎です」と文字起こしされた。社名が「○○テクノロジー」なのに「○○テック野路ジー」と分割されてしまった。プロジェクト名「Velocity」が「ベロシティ」ではなく「別ロシティ」と出力された。
こうした誤変換は、AI音声認識の精度が向上した2026年現在でも毎日発生している。Whisper、Google Cloud Speech-to-Text、Azure Speech Services——いずれのモデルであっても、汎用的な学習データに含まれない組織固有の固有名詞は誤認識される傾向にある。
ただし、MinuteKeep のユーザーは、この課題を「確実に」根本から解決する手段を持っている。辞書機能がそれだ。本稿では、辞書登録の実践的な手順と、業界別の活用パターン、メンテナンスのベストプラクティスを詳しく解説する。
議事録作成を自動化しませんか? MinuteKeepは、会議を録音するだけでAIが文字起こし・要約・タスク抽出まで自動化。9言語対応、月額0円、30分無料。
よくある固有名詞誤変換パターン10選
Whisperが特に誤変換しやすい10のパターンを見てみよう。
1. 人名の同音異義語化
「田中」→「棚課」「棚中」「棚仲」。日本語の同音異義語の多さによる誤変換。音声認識では「たなか」という音列に対して、訓練データに含まれる別の漢字を選んでしまう。人名は特に被害が大きい。
対策登録:
- 誤「棚課」→ 正「田中」
- 誤「棚中」→ 正「田中」
- 誤「棚仲」→ 正「田中」
2. 企業名の分解・変形
「MinuteKeep」→「ミニット キープ」「ミニッツキープ」。複合語や外来語の企業名が分割されたり、異なる語に置き換えられるケース。
対策登録:
- 誤「ミニット キープ」→ 正「MinuteKeep」
- 誤「ミニッツキープ」→ 正「MinuteKeep」
3. カタカナ英語の音近似
「API」→「エーピーアイ」「エーピーアー」。英字表記が音声化される際に別の単語に置き換わる。「SaaS」→「サース」「ソース」などが典型例。
対策登録:
- 誤「エーピーアー」→ 正「API」
- 誤「ソース」→ 正「SaaS」
- 誤「クーバネティス」→ 正「Kubernetes」
4. 略称・アクロニムの全展開
「DX」→「ディーエックス」「ディーエクス」。アルファベットの略称が音声で読み上げられる際に、別の表記になるパターン。
対策登録:
- 誤「ディーエクス」→ 正「DX」
- 誤「エムエンディー」→ 正「M&A」
- 誤「ピーディーエフ」→ 正「PDF」
5. 専門用語の誤字化
「インフォームドコンセント」→「インフォ無ドコンセント」「インフォー無どコンセント」。複雑な漢字や専門用語が部分的に誤認識される。
対策登録:
- 誤「インフォ無ドコンセント」→ 正「インフォームドコンセント」
6. 複合語の変形
「受け入れ検査」→「受け入れ研査」「受けいれ言査」。日本語特有の複合語で、後ろの要素が誤認識されるケース。
対策登録:
- 誤「受けいれ言査」→ 正「受け入れ検査」
7. 音読み・訓読み混同
「製造」→「制造」「清造」。同音異義語が異なる漢字で出力されるケース。特に音読み・訓読みが異なる語で起きやすい。
対策登録:
- 誤「清造」→ 正「製造」
8. 英語ブランド名の日本語化
「Salesforce」→「セールスフォース」「セールスフォース」(正しいが、社内で「SF」と呼ぶ場合)。英語固有名詞がカタカナに変換される際の表記ゆれ。
対策登録:
- 誤「セールスフォース」→ 正「Salesforce」(または「SF」)
9. 数字を含む固有名詞の誤認識
「5G」→「ゴージー」「ゴージ」「五G」。数字と文字の混在が認識されにくい。
対策登録:
- 誤「ゴージー」→ 正「5G」
- 誤「IOU」→ 正「IoT」
10. 組織内の独自用語・プロジェクト名
「Project Velocity」→「プロジェクト別ロシティ」。組織独自のプロジェクト名や造語が、Whisperの訓練データに含まれないため誤変換される。
対策登録:
- 誤「プロジェクト別ロシティ」→ 正「Project Velocity」
MinuteKeep辞書機能の設定手順(4ステップ)
MinuteKeepの辞書機能は、iOS アプリケーション内の「設定」画面から直接アクセスできる。初回セットアップから継続的な運用まで、すべてアプリ内で完結する。
ステップ1:アプリを開いて「設定」に進む
- MinuteKeepアプリをiPhoneで起動する
- 画面下部のタブバーから「⚙️ 設定」をタップ
- 設定画面内の「辞書」セクションを探してタップ
初回訪問時は、辞書一覧が空の状態で表示される。「+ 追加」または「新規登録」ボタンが見える。
ステップ2:誤変換語と正しい語を入力
「+ 追加」ボタンをタップすると、2つのテキストフィールドが出現する
- 上段:「誤変換語」(Whisperが実際に出力した間違った語)
- 下段:「正しい語」(本来表示されるべき語)
上段フィールドには、実際の文字起こし結果から誤った部分をコピー&ペーストする
- 例:Whisperが「棚課部長」と出力した場合、このテキストを上段に入力
下段フィールドには、正しい表記を入力する
- 例:「田中部長」
「保存」ボタンをタップして辞書に登録される
実践のコツ: 推測で登録してはいけない。「多分この人の名前は『たなか』と『棚課』と『棚仲』で誤変換されるだろう」という予測ではなく、実際の音声を録音して、Whisperの出力を確認してから登録する方が確実だ。
ステップ3:登録直後の次の録音で確認
- 辞書登録後、実際に会議または音声を録音する
- 文字起こしが完了するのを待つ
- Result画面で、登録した固有名詞が正しく表示されているか確認
- 置換されていたら成功。されていなければ、誤変換語の入力が正確でなかった可能性がある(Whisperの出力が異なるパターンが存在する)
ステップ4:辞書を積み上げる(継続的メンテナンス)
- 毎回の文字起こし完了後、Result画面で誤変換を確認
- 残っている誤変換を拾い出す
- 設定 → 辞書 から新規登録
- 2〜3回の会議でカバーされた主要な固有名詞が、4回目以降はほぼ正確に出力される
積み上げの目安: 社内の人名(部長〜管理職)、社名、主要なプロダクト名、常用する専門用語を中心に、20〜50件の辞書エントリがあれば、主要な誤変換は解消できる。
業界別:実践的な辞書登録例
誤変換のパターンは業界によって異なる。以下は各業界での典型的な登録例を示す。
IT・SaaS企業向け辞書登録例
| Whisper出力(誤) | 正しい表記 | 登録理由 |
|---|---|---|
| ギットハブ | GitHub | VCS関連は音読みで誤変換されやすい |
| ドッカー | Docker | コンテナ技術の重要用語 |
| クーバネティス / クーバーネティス | Kubernetes | k8sと並ぶインフラの重要用語 |
| ジラ / ジーラ | Jira | プロジェクト管理の中核ツール |
| テラフォーム | Terraform | IaC(Infrastructure as Code)の標準 |
| パイソン | Python | プログラミング言語 |
| アングラー | Angular | Webフレームワーク |
| リアクト | React | フロントエンド技術の最重要語 |
登録のポイント: IT企業では英語のテクノロジーワードが多く出現するため、カタカナ読みと英字表記の両方を登録しておくと対応範囲が広がる。
製造・メーカー企業向け辞書登録例
| Whisper出力(誤) | 正しい表記 | 登録理由 |
|---|---|---|
| 改善活動 | 改善活動 | (多くはそのまま。ただしカイゼン活動と出る場合) |
| 受けいれ言査 | 受け入れ検査 | 複合語の後部誤変換 |
| 鋳型(うがた) | 金型 / 鋳型 | 業界独特の用語 |
| フェイエムイー | FMEA | 品質管理の標準手法 |
| シックスシグマ | シックスシグマ | 統計的品質改善の重要概念 |
| オイーエム | OEM | 外注製造の契約形態 |
| 仕様変更れんらく書 | 仕様変更連絡書 | 社内文書の公式名称 |
| しんらい性 | 信頼性 | 製品品質の重要用語 |
登録のポイント: 製造業は業界用語や社内独特の表記が多く、標準化された表現があっても社内規定が優先される。事前に「正しい表記」を社内ガイドで確認してから登録すること。
医療・ヘルスケア企業向け辞書登録例
| Whisper出力(誤) | 正しい表記 | 登録理由 |
|---|---|---|
| 心房細働 / 心房細動 | 心房細動(AF) | 不整脈関連の医学用語 |
| ティーピーエー | tPA | 血栓溶解療法の標準薬剤 |
| インフォ無どコンセント | インフォームドコンセント | 医療の基本概念 |
| 電子カルテ | 電子カルテ(HER) | 医療記録システムの重要インフラ |
| クリニカルパス | クリニカルパス | 医療進行管理の標準 |
| ナースコール | ナースコール | 病院設備・システム |
| 処方箋 | 処方箋 | (もし誤変換される場合) |
| 診断書 | 診断書 | 医療文書の基本 |
登録のポイント: 医療業界では合法性・責任が極めて重要。辞書機能による置換は患者安全と医療記録の正確性に関わるため、置換後も必ず医療専門家による最終確認を行うこと。辞書は「時短ツール」ではなく「初期フィルタ」に過ぎない。
法務・士業向け辞書登録例
| Whisper出力(誤) | 正しい表記 | 登録理由 |
|---|---|---|
| 免債事項 | 免責事項 | 法的重要性の高い用語 |
| 損害倍増 | 損害賠償 | 同音異義語による誤変換(特に危険) |
| エヌディーエー | NDA | 秘密保持契約の標準略称 |
| アイピーオー | IPO | 資本市場用語 |
| デューデリジェンス | デューデリジェンス(DD) | M&Aの標準プロセス |
| 著作権侵怪 | 著作権侵害 | 知的財産権の基本 |
| 契約書 | 契約書 | (多くはそのまま。ただし異表記が出る場合) |
| 約因 | 約因 | 法学用語の誤変換 |
登録のポイント: 法律文書では同音異義語の誤変換が特に危険(「制裁」と「清算」など)。辞書の置換後も、リーガルレビュー前に必ず人間による目視確認プロセスを組み込むこと。
教育機関向け辞書登録例
| Whisper出力(誤) | 正しい表記 | 登録理由 |
|---|---|---|
| 学習指導要領 | 学習指導要領 | (もし誤変換される場合) |
| ディプロマポリシー | ディプロマポリシー | 大学の公式方針 |
| 認定試験 | 認定試験 | 資格制度の用語 |
| アクティブラーニング | アクティブラーニング | 教育手法の標準用語 |
| 教務委員会 | 教務委員会 | 教育機関の構成単位 |
| 教科横断的 | 教科横断的 | カリキュラム設計の重要概念 |
登録のポイント: 教育機関は業界標準用語が多く、かつ公的な文書(学位授与方針など)に使用されるため、正確な表記が重要。大学・高校の場合は、事前に教務部から正式な用語リストを取得すると辞書登録が効率化される。
辞書登録の際に気をつけるポイント
「実際の出力」から逆算する
辞書登録を成功させるコツは、「多分こう変換されるだろう」という推測ではなく、「実際にこう変換された」という事実から逆算することだ。
推奨フロー:
- テスト音声を録音(30秒程度で十分)
- 文字起こし完了後、Result画面で実際の出力をコピー
- その出力テキストを上段フィールドに貼り付け
- 下段に正しい表記を入力
- 保存
このやり方なら、誤変換語の入力ミスが発生しない。
表記ゆれ・大文字小文字の複数登録
同じ語でもWhisperの出力にばらつきが生じることがある。例えば:
- 「Kubernetes」が「kubernetes」「クーバネティス」「クーバーネティス」の3パターンで出力される
- 「MinuteKeep」が「minutekeep」「ミニットキープ」の両方で出力される
こうしたケースでは、出現頻度が高いパターンを優先的に登録し、見落としパターンは4〜5回の録音後に追加する段階的なアプローチが効率的だ。
複数語フレーズの登録
2語以上の固有名詞も登録可能だ。例えば:
- 誤「フォーシーエム株式会社」→ 正「株式会社フォーシーエム」
- 誤「みにゅーときーぷ」→ 正「MinuteKeep」
- 誤「プロジェクト別ロシティ」→ 正「Project Velocity」
組織の正式名称や複合語は、フレーズとしてそのまま登録できる。
文脈を考慮した設計
同音異義語の場合、1つの誤変換が複数の正解を持つことがある。例えば:
- 「たなか」→「田中(人名)」の場合と「棚課(部署名)」の場合
後処理辞書の構造上、1対1の対応しか設定できないため、こうした文脈依存的な置換は不可能だ。代わりに、より頻度の高い置換を優先し、少数派は手動修正の対象とする。
辞書管理のベストプラクティス
定期的な棚卸し(四半期ごと)
- 製品名やプロジェクト名が変わった
- 担当者・部長が交代した
- プロジェクトが完了して不要になった
こうした変化に合わせて、辞書内容を定期的に見直すこと。古いエントリが間違った置換を引き起こす可能性がある。
重要な会議の前日に追加
新規クライアントの初回ミーティング、製品ローンチのキックオフ、M&Aの交渉——こうした重要な場面では、事前に確認できる社名、人名、製品名を登録しておくと、議事録の事後修正作業がほぼゼロになる。登録作業は1件あたり30秒以内で済む。
複数ユーザー間でのベストプラクティス
MinuteKeepの辞書はローカル保存(デバイス単位)のため、チーム内で共有される。チーム全体で統一的に使用する場合は:
- 代表ユーザーが社内の標準用語表を辞書に登録
- 他のメンバーは同じiPhoneの場合、メモアプリなどで共有テーブルを作成
- 定期的に「新規追加されたエントリ」を共有
よくある質問(FAQ)
Q. 辞書機能は無料の30分枠から使えますか?
はい。辞書機能はプランに関係なく、インストール直後から利用可能です。30分の無料枠での録音から辞書が自動適用されます。追加料金は一切かかりません。
Q. 登録した語は何回の録音にも自動適用されますか?
はい。一度登録した辞書エントリは、以降のすべての新規録音に自動適用されます。追加設定は不要です。
Q. 既存の議事録(辞書登録前の古い記録)に辞書を遡及適用できますか?
いいえ。辞書は新規録音・文字起こしからのみ適用されます。既存のテキストには適用されないため、必要に応じてResult画面の編集機能で手動修正してください。
Q. 登録語数に上限はありますか?
公式な上限は設けられていません。実用的には、特定のチームや職種でよく出現する固有名詞を20〜80件カバーすれば、主要な誤変換は解消されるケースがほとんどです。
Q. 同じ誤変換が複数の正解に対応している場合はどうすればいいですか?
後処理辞書の構造上、1対1の対応しか設定できません。例えば「たなか」が「田中(人名)」にも「棚科(部署)」にもなるケースは、より頻度の高い置換を優先し、少数派は手動修正の対象とします。または、文脈を明確にした長めのフレーズを登録する(「鈴木さんの部下の…」など)ことで回避できる場合もあります。
Q. 英語の音声に対しても日本語の辞書エントリが適用されますか?
はい。MinuteKeepの辞書は言語横断的に機能します。日本語ベースの会議に英語の社名(Salesforce、Microsoftなど)が登場する場合、その置換も実行されます。
Q. 辞書データはクラウドに保存されますか?
いいえ。すべてのデータはiPhone内にローカル保存され、クラウドに送信されません。社内の機密情報や顧客名を辞書に含める場合でも、外部流出のリスクは発生しません。
MinuteKeepで辞書機能を実際に使ってみる
固有名詞の誤変換が日常的に発生している場合、MinuteKeepの辞書機能は実質的な時短ツールになります。
初回スタートアップフロー:
- App Storeから無料ダウンロード
- インストール時に30分分の無料枠が付与
- 設定 → 辞書 で自社名と主要メンバー5〜10名を登録(所要時間5〜10分)
- 次の会議を録音して効果を確認
料金体系(従量制・サブスクなし):
- 30分:無料(インストール時付与)
- 2時間:¥150
- 7時間:¥480
- 18時間:¥1,000
- 高精度モード:2倍時間消費
固定料金がないため、月に1回だけ会議がある場合でも、固定費の負担がない。
App Storeでダウンロード:
MinuteKeep - AI議事録アプリ
まとめ
AI音声認識が固有名詞を誤変換する理由は、モデルが「統計的に最も可能性の高い語を選ぶ」という設計に由来する。組織固有の語彙は訓練データに含まれないため、音が近い一般語に置き換えられる。これはモデルの精度向上だけでは完全には解消できない問題だ。
MinuteKeepの辞書機能は、この構造的な限界に対して、「AIの判断を後処理で確定的に上書きする」というアプローチで対応している。Whisperが出力したテキストに対して、登録したペアを確実に適用するため、辞書に登録された語は必ず正しく表示される。
設定は4ステップで完結し、初回登録後は以降のすべての録音に自動適用される。社名、人名、専門用語、略称——組織固有の語彙を辞書に積み上げていくことで、AI議事録の後処理コストを実質的にゼロに近づけられる。