皆さんは電話の向こうの相手が「本物の人間」かどうか、自信を持って聞き分けられるでしょうか?
SiriやAlexaなど、少し不自然なAIの声なら判別できる――そう思っている人も多いかもしれません。
しかし今、最新のAIによる「ボイスクローン技術」が、人間の声と見分けがつかないほどのリアルさを手に入れつつあります。
ついに“AIの声”と“本物の人間の声”の境界が消えつつあるのです。
研究の詳細は2025年9月24日付で科学雑誌『PLoS One』に掲載されています。
目次
- AIの声、本当に人間と区別できない?
- なぜ聞き分けられない? 広がる社会的リスクも
AIの声、本当に人間と区別できない?
AI音声技術の進化は、私たちの生活に大きなインパクトを与えています。
バーチャルアシスタントや自動応答サービス、オーディオブックのナレーションまで、あらゆる場面でAIの声が使われています。
特に注目されているのが「ボイスクローン」と呼ばれる技術です。
これは特定の人の声をAIが模倣することで、本人そっくりの音声を数分のサンプルから再現するものです。

では、この最先端技術がどれほど本物に近づいているのか。
それを調べるため、英ロンドン大学クイーン・メアリー(QMUL)の研究チームは大規模な実験を行いました。
実験では、40人分の本物の人の声と、AIが生成した2種類の音声(ゼロから作られた汎用AI音声と、特定人物の声を模したクローン音声)を用意。
イギリス在住の成人被験者に「どれが本物の人間の声か」「どれがAIか」を判定してもらいました。
その結果は驚くべきものでした。
ゼロから作られたAI音声については、まだ6割近くの人が「これはAIだ」と気付くことができました。
しかし「ボイスクローン」音声については、半数以上が「本物の人間の声」と誤認し、正解率は偶然レベルにまで低下したのです。
「どちらが本物か」はもはや直感に頼るしかなく、多くの人が自信を持てなくなったのです。
さらにAI音声と人間の声は「どちらがより本物らしいか」という評価でもほぼ互角。
AIが「人間の声以上にリアル(ハイパーリアリズム)」になる現象はまだ観測されていませんが、「人間の声とまったく同じくらいリアル」と感じる人が多数派となったのです。
なぜ聞き分けられない? 広がる社会的リスクも
なぜこれほどまでにAI音声は本物に近づいたのでしょうか?
研究で使われた「ボイスクローン」は、一般向けに市販されているAI音声合成サービス(ElevenLabs社の技術)を使用し、たった4分間の録音データから本人そっくりの声を生成しました。
背景ノイズや話し方の癖まで忠実に再現するため、ほとんどの人は「違和感のない声」として聞いてしまうのです。
また、人間は“人の声”を聞いたとき、無意識のうちに「これは本物だ」と思い込む傾向もあります。
実験では、被験者の多くがAI音声であってもつい「人間の声だ」と判定しがちで、こうしたヒューマン・バイアスも判別の難しさを強めています。
この現象は、私たちの生活や社会にも新たなリスクをもたらします。
もし犯罪者がAIであなたの声をクローンし、銀行の本人確認を突破したり、家族や友人になりすまして詐欺を働いたりすることも技術的には可能になりつつあります。
実際、海外では既にクローン音声を使った詐欺事件も報告されています。
さらに政治家や有名人の発言を“捏造”するフェイク音声動画の危険性も現実味を増しています。
一方で、視覚障害者向けの音声ガイドや、声を失った人への「本人の声の再生」など、社会的に有益な活用も急速に進んでいます。
AI音声が“人間らしさ”を手にしたことで、その可能性とリスクはどちらも広がっているのです。
参考文献
AI voices are now indistinguishable from real human voices
https://www.livescience.com/technology/artificial-intelligence/ai-voices-are-now-indistinguishable-from-real-human-voices
元論文
Voice clones sound realistic but not (yet) hyperrealistic
https://doi.org/10.1371/journal.pone.0332692
ライター
千野 真吾: 生物学に興味のあるWebライター。普段は読書をするのが趣味で、休みの日には野鳥や動物の写真を撮っています。
編集者
ナゾロジー 編集部