ノイズキャンセリングで声が消せない理由

記事内に広告が含まれています

ノイキャンをオンにすると、飛行機のエンジン音や電車の走行音はよく抑えられるのに、隣の席の会話や駅の音声などはしっかり聞こえてくる、ということがあると思います。これは、製品の不具合ではなく、ANCという技術の原理的な制約に由来します。

ANC(Active Noise Cancellation)は物理法則と信号処理の両面から、高い周波数の音を打ち消すことが困難です。制約の要因は波長・位相精度・処理遅延・発振リスクの4つに分類でき、メーカーや価格帯に関係なく共通しています。

ANCは「逆位相の音波をぶつけて打ち消す」技術

ANCの原理はシンプルです。外部マイクで周囲のノイズを拾い、DSP(デジタル信号プロセッサ)がそのノイズの波形を反転させた逆位相の音波を生成し、イヤホンやヘッドホンのスピーカーから出力します。元のノイズと逆位相の音が鼓膜の手前で合流すると、波の山と谷が打ち消し合って音圧が下がります。

ANCの方式には3種類あり、外部マイクのみでノイズを先読みする「フィードフォワード方式」、耳の内側に配置したマイクで残存ノイズを拾って補正する「フィードバック方式」、そしてその両方を組み合わせた「ハイブリッド方式」です。ハイブリッド方式はソニーのWH-1000XM5やApple AirPods Proなど、現行のハイエンド製品で主流となっています。

理屈のうえでは、逆位相さえ正確に作れれば全帯域のノイズを消せるはずです。しかし「正確に」の難易度が、周波数によってまったく違います。

周波数が10倍になると、相殺が効く範囲は1/10に縮む

ANCが打ち消し効果を発揮できる空間的な範囲は、対象音の波長に直接比例します。学術研究では、ANCによって有意な減衰が得られる領域(zone of quiet)は、対象音の波長の約1/10と報告されています(”Active noise control at high frequencies”, P. Joseph, researchgate.net)。

音速を340 m/sとして、各周波数の波長と相殺有効半径を算出すると次のようになります。

周波数波長相殺有効半径(波長の1/10)
100 Hz3.4 m約34 cm
500 Hz68 cm約6.8 cm
1 kHz34 cm約3.4 cm
2 kHz17 cm約1.7 cm
5 kHz6.8 cm約6.8 mm
10 kHz3.4 cm約3.4 mm

100 Hzなら鼓膜の周囲34 cmの範囲で相殺が成立するため、イヤホンの装着位置が多少ずれても問題ありません。ところが5 kHzでは有効半径がわずか6.8 mmまで縮小し、鼓膜の位置がわずかに動いただけで相殺は破綻します。10 kHzになると有効半径は3.4 mmで、利用者ごとの耳道の形状差を吸収しきれません。

さらに、1 kHz以上では音の到来方向も影響します。人間の左右の耳の間隔は平均約21.5 cmで、これは約800 Hzの波長の半分に相当します。800 Hzを超えると、正面からの音には有効でも側方からの音では片耳で相殺、もう片耳で増幅が起きる可能性があります(Wikipedia, Active noise control)。

マイクからスピーカーまでの処理遅延が、高周波で致命的な位相ズレを生む

ANCには物理的な時間の壁もあります。マイクで音を拾ってからスピーカーで逆位相の音を出すまでに、ADC(アナログ→デジタル変換)→ DSP処理 → DAC(デジタル→アナログ変換)という信号処理パイプラインを通す必要があり、ここで必ず遅延が発生します。

ANC用チップを手がけるOle Wolff Electronicsは、許容できるデジタル群遅延の上限を5μs(マイクロ秒)としています(owolff.com)。ただし実際のANCシステムでは、デジタル処理に加えて音響伝搬やアナログ回路の遅延が上乗せされます。ここでは計算例として、デジタル遅延のみの5μsと、音響・アナログを含むシステム総遅延50μsの2パターンで位相ズレを比較します。

遅延がどれだけの位相ズレを生むかは、360° × 周波数 × 遅延時間で計算できます。

周波数位相ズレ(5μs)位相ズレ(50μs)
100 Hz0.18°1.8°
1 kHz1.8°18°
5 kHz90°
10 kHz18°180°

デジタル遅延だけなら20 kHzでも36°程度ですが、システム全体では5 kHzの時点で位相ズレが90°に達します。90°を超えると打ち消し効果はゼロになり、それ以上ずれると逆に音を増幅してしまいます。10 kHzでは位相が完全に反転して180°に達するため、打ち消すつもりの音波がそのまま上乗せされます。

フィードバック方式ではさらに条件が厳しくなります。内部マイクがスピーカーから出た音をそのまま拾ってしまう構造上、スピーカー→マイク間の音響遅延が追加されます。この制約により、フィードバック方式単体で安定して動作する帯域は50〜1000 Hz程度に限定されます(USPTO Patent 11678105, uspto.gov)。

位相ズレが大きくなると「消す」どころか「増える」ためメーカーは帯域を切る

ここで見落とされがちなのが、高周波での発振(ハウリング)リスクです。

逆位相(180°)からのズレが90°を超えると、打ち消し効果はなくなるだけでなく、正帰還ループに入って元の音を増幅してしまう場合があります。Ole Wolff Electronicsの技術資料では、高周波域では伝達関数の位相が急激に変動するため、ノイズレベルを増加させるリスクや、自己共振周波数で発振器になるリスクがあると指摘されています(owolff.com)。

このリスクを避けるために、ほとんどのANCシステムはフィルタ設計の段階で帯域を意図的に制限しています。Ole Wolff Electronicsが示す上限値は約1.2 kHzです。高周波にANCが「効かない」のではなく、効かせると逆効果になるためメーカーが意図的に切っている、と理解するのが適切です。

近年はディープラーニングを使ってノイズを数ミリ秒先まで予測し、遅延の制約(causality constraint)を回避しようとする研究が進んでいます(”Low-Latency Active Noise Control Using Attentive Recurrent Network”, pmc.ncbi.nlm.nih.gov, 2023)。ただし現時点でこの手法を実装した民生製品はなく、量産化には計算コストと消費電力の問題が残っています。

高周波の遮音はイヤーパッドとハウジングの仕事

ANCが低周波を担当する一方、高周波の遮音を引き受けるのはパッシブノイズアイソレーションです。具体的には、イヤーパッドの密着やハウジングの密閉構造による物理的な遮蔽がこれにあたります。

高周波は波長が短いため、メモリーフォームや合成皮革のような密度のある素材で減衰させやすい性質があります。イヤーパッドの密着度が高く、耳周りに隙間がないほど中高域の遮音性能は向上します。一方、低周波は波長が長いため、薄い壁やわずかな隙間でも簡単に回り込み、物理遮蔽だけでは十分な減衰が得られません。

低域はANCが、高域はパッシブが受け持つ。Sonosの技術解説でも、高周波の遮断にはパッシブ遮音が、低周波の低減にはANCが適していると明記されています(sonos.com)。ANC搭載ヘッドホンの多くがオーバーイヤー型の密閉設計を採用しているのも、ANCが苦手な帯域をパッシブ側で補うための設計判断です。

声の「意味」を運ぶ周波数帯にANCは届かない

では、なぜ人の声が消えずに残るのか。理由は声の周波数構造にあります。

人の声の基本周波数(声の高さを決める振動数)は、成人男性で85〜180 Hz、成人女性で165〜255 Hz程度です。この帯域はANCが得意とする範囲に入っており、実際にANCをオンにすると声の「低音成分」は減衰します。遠くの声がこもって聞こえにくくなる、という体験はこの効果によるものです。

ところが、人が声を「言葉として聞き取れる」かどうかを決めているのは、基本周波数ではなく、もっと上の帯域です。母音の識別に必要なフォルマント周波数はF1が250〜900 Hz、F2が850〜2500 Hz、F3が2500 Hz以上に分布しています。子音の弁別に必要な周波数成分は2〜8 kHzに集中しています。

ANCの実効上限が1〜1.5 kHz付近であることを考えると、声の「意味を運ぶ帯域」のうち、ANCがカバーできるのはF1の一部だけです。F2以上、つまり言葉の聞き取りに直結する成分はANCの有効帯域に入っておらず、パッシブ遮音に頼るしかありません。

ANCをオンにしたとき「声は聞こえるけど、何を言っているかはっきりわかる」という状態になるのは、声の低音成分はANCで減衰しているものの、子音やフォルマントの上位成分がそのまま鼓膜に届いているためです。

低周波の騒音にはANC性能を、高周波の騒音には遮音構造で選ぶ

ANCの物理的な限界を踏まえると、何を消したいかによって製品選びで重視すべきポイントが変わります。

飛行機のエンジン音や電車の走行音を抑えたい場合は、ANCの性能差がそのまま体感差に直結します。これらは100〜500 Hzの低周波が主成分であり、ANCが最も力を発揮する帯域です。

一方、カフェの会話やキーボードの打鍵音を抑えたい場合は、ANCよりもパッシブ遮音の設計を重視すべきです。これらは1 kHz以上の成分が多く、ANCの有効帯域に入っていません。イヤーパッドの素材と密着度、ハウジングの密閉性が体感上の遮音性能を左右します。カナル型イヤホンであれば、ノズルの挿入深度とイヤーピースのフィット感も重要です。

なお、ハイブリッド方式はフィードフォワードとフィードバックの両方を使うため、フィードフォワードのみの方式より帯域が若干広くなる傾向があります。ただし上述した物理的な限界は方式によらず共通であり、数百Hz分の差がつく程度です。

まとめ

ANCで人の声が消えないのは、高周波ほど相殺有効範囲が狭くなること、処理遅延が位相ズレを生むこと、そしてその位相ズレが発振リスクにつながることが重なった結果です。メーカーはこれらを踏まえてANCの帯域を1〜1.5 kHz付近で意図的に制限し、それより上はイヤーパッドやハウジングのパッシブ遮音に委ねています。

低周波のノイズにはANC性能が、高周波のノイズには遮音構造と装着フィットが効きます。消したい音の周波数帯を意識するだけで、製品選びの精度の向上につながります。


参考資料

P. Joseph, “Active noise control at high frequencies,” ResearchGate, 2006. researchgate.net / Ole Wolff Electronics, “Active Noise Cancellation,” 2024. owolff.com / USPTO, Patent No. 11678105 “Noise canceling headphones.” uspto.gov / Wikipedia, “Active noise control.” en.wikipedia.org / S. Hu et al., “Low-Latency Active Noise Control Using Attentive Recurrent Network,” PMC, 2023. pmc.ncbi.nlm.nih.gov / Sonos, “ノイズキャンセリングヘッドフォンの仕組み.” sonos.com / final, “技術用語解説 vol.6 ノイズキャンセリング.” final-inc.com

この記事を書いた人

PC歴15年以上。本業でデータ分析をしており、複数の情報源を横断して整理する作業が日常になっています。趣味はゲームで、PCとは長い付き合い。ゲームのためにパーツを調べ続けてきた結果、スペックの数字が自分の用途でどう意味を持つかを考えるのが習慣になりました。製品を選ぶときに「このスペックは自分に必要か」が判断しにくい部分を、できるだけ具体的に書くようにしています。

LITをフォローする
ガジェット
タイトルとURLをコピーしました